pytorch之onehot编码转换

2021年5月25日10:10:31 发表评论

对于分类问题,标签可以是类别索引值也可以是one-hot表示。以10类别分类为例,lable=[3] 和label=[0, 0, 0, 1, 0, 0, 0, 0, 0, 0]是一致的。现在给定索引标签,怎么将其转换为one-hot标签表示?

>>>class_num = 10
>>>batch_size = 4
# torch.LongTensor(batch_size,1).random_()生成shape为[batch_size,1]的随机张量
>>>label = torch.LongTensor(batch_size, 1).random_() % class_num
tensor([[0],
        [9],
        [2],
        [1]])
# torch.zeros()生成全0的张量
# scatter_(a,b,c)
>>>one_hot = torch.zeros(batch_size, class_num).scatter_(1, label, 1)
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.]])

下面解释下scatter_(dim,index,src)这个函数

scatter_(input, dim, index, src)将src中数据根据index中的索引按照dim的方向填进input中。

1 >>> x = torch.rand(2, 5)
2 >>> x
3 
4  0.4319  0.6500  0.4080  0.8760  0.2355
5  0.2609  0.4711  0.8486  0.8573  0.1029
6 [torch.FloatTensor of size 2x5]

1) dim = 0,分别对每列填充:

>>> torch.zeros(3, 5).scatter_(0, torch.LongTensor([[0, 1, 2, 0, 0], [2, 0, 0, 1, 2]]), x)

 0.4319  0.4711  0.8486  0.8760  0.2355
 0.0000  0.6500  0.0000  0.8573  0.0000
 0.2609  0.0000  0.4080  0.0000  0.1029
[torch.FloatTensor of size 3x5]

实现原理:

对于LoneTensor内的矩阵,暂且称为 tmp = [[0, 1, 2, 0, 0], [2, 0, 0, 1, 2]];将最终的 3*5的矩阵,暂且称为result。result初始为全0,需要经过scatter_处理。

举例:

对于tmp[0][0]=0->取x中x[0][0]=0.4319,将其插入到result[0][0],result[0][0]=0.4319;

对于tmp[0][1]=1->取x中x[0][1]=0.6500,将其插入到result[1][1],result[1][1]=0.6500;

对于tmp[0][2]=2->取x中x[0][1]=0.4080,将其插入到result[2][2],result[2][2]=0.4080;

......

对于tmp[1][0]=2->取x中x[1][0]=0.2609,将其插入到result[2][0],result[2][0]=0.2609;

对于tmp[1][1]=0->取x中x[1][1]=0.4711,将其插入到result[0][1],result[0][1]=0.4711。

......

看到这里,观察仔细的同学已经发现了,tmp[i][j]的值代替了result的行标(因为dim=0)

2) dim = 1,分别对每行填充

1 >>> z = torch.zeros(2, 4).scatter_(1, torch.LongTensor([[2], [3]]), 1.23)
2 >>> z
3 
4  0.0000  0.0000  1.2300  0.0000
5  0.0000  0.0000  0.0000  1.2300
6 [torch.FloatTensor of size 2x4]

tmp = [[2], [3]]

tmp[0][0]=2->取x中x[0][0]=0.4319,将其插入到result[0][2],result[0][2]=0.4319;

......

同样的,这里是tmp[i][j]的值代替了result列标

解释上面scatter_的实现

input.scatter_(1, label, 1)

因为src=1,所以填充值全为1,

tensor([[0],[9],[2],[1]])

第1行是0,所以input[0][0]=1

第2行是9,所以Input[1][9]=1

第3行是2,所以Input[2][2]=1

第4行是1,所以input[3][1]=1

总结

可以用下面这个公式表示

Input[if(dim=0)index[i][j] else i][if(dim=1)index[i][j] else j]=src[i][j]

 

参考文献:

https://www.cnblogs.com/shiyublog/p/10924287.html

https://blog.csdn.net/VictoriaW/article/details/72874637

flyingsheep

发表评论