1、Ai是什么?
人工智能(AI)是研究、开发用于模拟、延伸和扩展人类智能的理论、方法及技术的科学。它让机器具备类似人类的感知、推理、学习等能力。
AI 分弱人工智能和强人工智能,前者如语音助手、推荐算法,专注特定任务;后者追求通用智能,目前尚处探索阶段。
其核心技术有机器学习、深度学习等,通过数据训练模型实现自主决策。如今广泛应用于医疗、金融等领域,正深刻改变生产生活,推动社会效率提升与创新发展。
Ai对软件行业的影响:
AI 对软件行业影响广泛且深远。在开发环节,它革新了流程,借助大模型能快速生成代码框架与基础模块,缩短开发周期;还能基于海量数据为架构设计提供参考,助力团队选优。智能辅助工具让代码补全更精准、错误检测修复更高效。
测试方面,AI 可依功能与代码逻辑生成全面测试用例,通过分析历史数据预测、定位缺陷,驱动自动化测试执行,优化测试流程。
软件维护时,能实时监测、自动修复常见错误,依据数据预测故障,科学决策更新内容与时机。
在用户体验和功能创新上,AI 实现个性化定制,拓展出语音识别、图像识别等智能功能。这一系列变革重塑行业竞争格局,促使企业探索新商业模式 ,推动软件行业向智能化、高效化迈进 。
2、Ai学习
2.1 python语言学习【略】
若想深入学习可以自行学习以下网站,本blog默认各位小伙伴已拥有python有基础学习的技能
https://www.runoob.com/python3
环境准备:
(1)安装python 【可选】
(2)安装Anaconda【虚拟环境】
2.2 scikit-learn【机器学习库】
scikit-learn 是用 Python 编写的开源机器学习库,它集成了分类、回归、聚类等多种算法,还提供了数据预处理、模型选择与评估等工具,拥有简洁一致的 API 接口,极大降低了机器学习应用门槛。
作为机器学习领域的经典工具,它支持多种监督和无监督学习任务,与 NumPy、pandas 等数据科学库无缝衔接,代码具有高质量和可扩展性,文档完善且社区活跃。无论是学术研究还是工业应用,scikit-learn 都是数据科学家和机器学习工程师的得力助手,广泛应用于数据挖掘、数据分析和预测建模等领域。
简单理解:sklearn实际就提供分类、回归、聚类等多种算法是用于处理数据,提供给模型训练的工具。
学习教程:
https://www.runoob.com/sklearn/sklearn-tutorial.html
2.2.1 安装sklearn
(1)创建环境并安装pip工具
conda create --name sk python=3.10.0 pip
(2) 下载依赖
pip install numpy
pip install scipy
pip install scikit-learn
备注:
scikit-learn依赖于numpy和scipy
2.2.2 通用学习模式
案例:鸢尾花数据集
import numpy as np
from sklearn import datasets
# from sklearn.cross_validation import train_test_split
# 模块名错误:sklearn.cross_validation 是旧版本 scikit-learn(现已简称为 sklearn)中的模块名。从 sklearn 的较新版本(0.18+)开始,该模块已经被迁移至
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
# 1. 加载数据集
iris = datasets.load_iris()
# 2. 提取特征矩阵
iris_x = iris.data
# 3. 提取标签数组
iris_y = iris.target
print(iris_x)
print("--------------------------------------")
print(iris_y)
print("--------------------------------------")
# 将data拆分为学习的data和测试的data,其中测试的比例占30%
x_train, x_test, y_train, y_test = train_test_split(iris_x, iris_y, test_size=0.3)
print(y_train)
print("--------------------------------")
# 开始训练模型
# 1. 模型初始化
knn = KNeighborsClassifier()
# 2. 模型训练
# fit 方法用于对模型进行训练
knn.fit(x_train, y_train)
# 3. 模型预测
# predict 方法会对测试数据 x_test 进行预测
print(knn.predict(x_test))
# 4. 打印真实标签
print(y_test)
结果:
2.2.3 datasets数据集
概念:数据集是机器学习的基石,其质量、规模和特性直接影响模型性能。合理选择、管理和预处理数据集,以及关注伦理问题,是构建有效且可靠 AI 系统的关键。
'''
sklearn的datasets学习
'''
from sklearn import datasets
from sklearn.linear_model import LinearRegression
# 1. 加载数据集
loaded_data = datasets.fetch_california_housing()
# loaded_data = datasets.load_boston() # 已弃用(v1.2+)
# 提取特征和目标值
data_x = loaded_data.data
data_y = loaded_data.target
# 初始化并训练模型
model = LinearRegression()
model.fit(data_x, data_y)
# 预测与真实值对比
print(model.predict(data_x[:4, :])) # 预测前4个样本的房价