监督学习与无监督学习的区别

技术背景

在人工智能和机器学习领域，监督学习和无监督学习是两种重要的学习范式。机器学习是一类数据驱动的算法，与传统算法不同，它依靠数据来“告知”什么是“好的答案”。例如，在图像人脸识别任务中，传统算法可能会尝试定义人脸的特征，而机器学习算法则通过大量的人脸和非人脸图像示例进行学习，从而能够预测未见过的图像是否包含人脸。

实现步骤

监督学习

数据准备：收集带有标签的训练数据，即每个输入数据都有对应的目标输出。例如，在手写数字识别任务中，每个手写数字图像都有对应的数字标签（0 - 9）。
模型选择：选择适合任务的监督学习算法，如分类算法（如决策树、支持向量机）或回归算法（如线性回归）。
模型训练：将训练数据输入到模型中，让模型学习输入和输出之间的映射关系。
模型评估：使用测试数据评估模型的性能，如准确率、召回率等。
模型应用：使用训练好的模型对新的数据进行预测。

无监督学习

数据准备：收集无标签的原始数据。
模型选择：选择适合任务的无监督学习算法，如聚类算法（如K - 均值聚类）或关联规则学习算法。
模型训练：将数据输入到模型中，让模型自动发现数据中的结构或模式。
结果分析：分析模型输出的结果，如聚类的结果或关联规则。

核心代码

监督学习示例（使用Python和Scikit - learn库进行手写数字分类）

from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

# 加载数据集
digits = load_digits()
X = digits.data
y = digits.target

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 创建支持向量机模型
model = SVC()

# 训练模型
model.fit(X_train, y_train)

# 预测
y_pred = model.predict(X_test)

# 评估模型
accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy}")

无监督学习示例（使用Python和Scikit - learn库进行K - 均值聚类）

from sklearn.datasets import make_blobs
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt

# 生成模拟数据
X, _ = make_blobs(n_samples=300, centers=4, cluster_std=0.60, random_state=0)

# 创建K - 均值聚类模型
kmeans = KMeans(n_clusters=4)

# 训练模型
kmeans.fit(X)

# 获取聚类标签
labels = kmeans.labels_

# 可视化聚类结果
plt.scatter(X[:, 0], X[:, 1], c=labels, s=50, cmap='viridis')
centers = kmeans.cluster_centers_
plt.scatter(centers[:, 0], centers[:, 1], c='black', s=200, alpha=0.5)
plt.show()