Pytorch入门实战(1) - 实现线性回归



中文 | English

涉及知识点

Pytorch nn.Module的基本使用

Pytorch nn.Linear的基本用法

将线性回归神经网络化

线性回归也可以看作一个简单的神经网络。以一个特征的一元线性回归为例:

$$ \begin{aligned} y = w \cdot x + b \end{aligned}$$

可以改造下图神经网络:


在这里插入图片描述

若将x泛化为向量,即 $x=(x_1, x_2, ... , x_n)$,则对应神经网络为:


在这里插入图片描述

Pytorch 代码实现

一元线性回归Pytorch方式实现

```python
import torch
import matplotlib.pyplot as plt
```

首先生成测试数据:

```python
X = torch.rand(100, 1) * 10  # 生成一个100行一列的数据;该数据服从[0,10]的uniform分布
X[:3]
```

tensor([[3.7992],
        [5.5769],
        [8.8396]])
```python
y = 3 * X + 10 + torch.randn(100, 1) * 3 # 计算其对应的y值;y也是100行1列的
y[:3]
```

tensor([[19.4206],
        [29.7004],
        [38.3561]])

将生成的数据绘制成散点图,看下效果:

```python
plt.scatter(X.numpy(), y.numpy())
plt.show()
```


[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-8Dx2UcL6-1637306141765)(output_6_0.png)]

接下来定义线性回归预训练模型:

```python
class LinearRegression(torch.nn.Module):
    """
    模型需要继承 `torch.nn.Module`,在Pytorch中,模型都需要继承该类
    """

    def __init__(self):
        super().__init__()  # 初始化Module类

        """
        定义我们神经网络的第一层(线性层)。其接受的重要三个参数:
        in_features: 输入神经元的个数
        out_features:输出神经元的个数
        bias:是否包含偏置

        更多,关于torch.nn.Linear,可以参考:https://pytorch.org/docs/stable/nn.html#linear-layers
        """
        self.linear = torch.nn.Linear(in_features=1, out_features=1, bias=True)

    def forward(self, x):
        """
        前向传播计算神经网络的输出
        """
        predict = self.linear(x)
        return predict    
```

到这里预训练模型已经构建完毕。初始化预训练模型:

```python
model = LinearRegression() # 初始化模型
```

定义梯度下降器,这里选择随机梯度下降法:

```python
"""
torch.optim.SGD 接受几个重要的参数:

- params: 模型参数
- lr: 学习率
"""
optimizer = torch.optim.SGD(model.parameters(), lr=1e-3)

# 这里可以看下模型参数
for param in model.parameters(): # 因为模型有多个参数,所以model.parameters会返回一个可迭代的对象
    print(param)
```

Parameter containing:
tensor([[-0.0462]], requires_grad=True)
Parameter containing:
tensor([-0.5942], requires_grad=True)

定义损失函数,这里使用MSE:

```python
loss_function = torch.nn.MSELoss()
```

此时就可以训练模型了:

```python
for epoch in range(10000): # 训练10000次
    """
    1. 将X带入模型,其会自动调用前向传递,计算出每个x对应的y值
    X.shape 和 predict_y.shape 都为(100,1), 
    """
    predict_y = model(X) 

    """
    2. 通过损失函数计算损失
    """
    loss = loss_function(predict_y, y)

    """
    3. 进行反向传播
    """
    loss.backward()

    """
    4. 更新权重
    """
    optimizer.step()

    """
    5.清空optimizer的梯度,否则会影响下次迭代
    """
    optimizer.zero_grad()
```

看下最后的参数,结果符合预期:

```python
for param in model.parameters(): # 因为模型有多个参数,所以model.parameters会返回一个可迭代的对象
    print(param)
```

Parameter containing:
tensor([[3.0524]], requires_grad=True)
Parameter containing:
tensor([9.2819], requires_grad=True)

再重新绘制一下图,看下最终效果:

```python
plt.scatter(X, y)
plt.plot(X, model(X).detach().numpy(), color='red')
plt.show()
```


[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5Se1imxM-1637306141771)(output_20_0.png)]

Next Post
No Comment
Add Comment
comment url