距离度量及相关性分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1、 计算styucvdsk 和ustupcsfsk 之间的编辑距离

st y uc vd sk

u stu p c sf sk 插入了一个u ,st 不变,删除一个y ,u 不变,插入一个p ,c 不变,v 修改为s,d 修改为f ,sk 不变

styucvdsk 和ustupcsfsk 之间的编辑距离为5

2、 对于下面的向量x 和y ,计算指定的相似性或距离度量。

a) X=(1,1,1,1),y=(2,2,2,2),余弦、相关、欧几里德

余弦:

∥X ∥= 12+12+12+12= 4=2

∥Y ∥= 22+22+22+22= 16=4

X ∙Y= 1×2 + 1×2 + 1×2 + 1×2 =8

cos(x.y)=8=1 相关系数:

X 0=

1+1+1+1=1 Y 0=2+2+2+2=2 cov(x,y)= 1−1 ∗ 2−2 + 1−1 ∗ 2−2 + 1−1 ∗ 2−2 + 1−1 ∗ 2−2 3=0

σx = 1−1 2+ 1−1 2+ 1−1 2+ 1−1 2=0 σy = ( 2−2 2+ 2−2 2+ 2−2 2+ 2−2 2)4−1

=0 ρxy =0

欧几里德:

2−1 2+ 2−1 2+ 2−1 2+ 2−1 2=2

余弦相似度、相关系数、欧几里得分别是1,0,2;

b) X=(0,1,0,1),y=(1,0,1,0), 余弦、相关、欧几里德、jaccard

余弦:

∥X ∥= 02+12+02+12= 2

∥Y ∥= 12+02+12+02= 2

X ∙Y= 0×1 + 1×0 + 0×1 + 1×0 =0

cos(x.y)=

0 2× 2=0

相关系数:

X 0=

0+1+0+1=0.5 Y 0=1+0+1+0=0.5 cov x,y = 0−0.5 ∗ 1−0.5 + 1−0.5 ∗ 0−0.5 + 0−0.5 ∗ 1−0.5 + 1−0.5 ∗ 0−0.5 4−1=−1 σx = 0−0.5 2+ 1−0.5 2+ 0−0.5 2+ 1−0.5 2= 1 σy = 1−0.5 2+ 0−0.5 2+ 1−0.5 2+ 0−0.5 24−1= 13 ρxy =−

13 3× 3

欧几里德:

2222=2

Jaccard:

x 2=02+12+02+12=2

y 2=12+02+12+02=2

X∙Y=(0×1)+(1×0)+(0×1)+(1×0)=0

ℐx,y=

xy

22

=

=0

余弦相似度、相关系数、欧几里德、Jaccard系数分别是0,-1,2,0;

c)X=(0,-1,0,1),y=(1,0,-1,0), 余弦、相关、欧几里德

余弦:

∥X∥=02+(−1)2+02+12=2

∥Y∥=12+02+(−1)2+02=2

X∙Y=0×1+−1×0+0×(−1)+1×0=0

cos(x.y)=

2×2

=0

相关系数:

X0=0−1+0+1

4

=0

Y0=1+0−1+0

4

=0

cov(x,y)

=

0−0∗1−0+−1−0∗0−0+0−0∗−1−0+1−0∗0−0 =0

σx=0−02+−1−02+0−02+1−02

4−1

=2

σy=1−02+0−02+−1−02+0−02

4−1

=2

ρxy=cov(x,y)

=

2×2

=0

欧几里德:

2222=2

余弦相似度、相关系数、欧几里德分别是0,0,2;

d)X=(1,1,0,1,0,1),y=(1,1,1,0,0,1), 余弦、相关、jaccard

余弦:

∥X∥=12+12+02+12+02+12=4=2

∥Y∥=12+12+12+02+02+12=4=2

X∙Y=1×1+1×1+0×1+1×0×0×0+1×1=3

cos(x.y)=

3

2×2

=0.75

相关系数:

X0=1+1+0+1+0+1

6

=

2

3

Y0=1+1+1+0+0+1

6

=

2

3

cov(x,y)

=1−23∗1−23+1−23∗1−23+0−23∗1−23+1−23∗0−23+0−23∗0−23+1−23∗1−23

6−1

=1 15

σx=1−

2

3

2

+1−2

3

2

+0−2

3

2

+1−2

3

2

+0−2

3

2

+1−2

3

2

=

4

σy=1−

2

3

2

+1−2

3

2

+1−2

3

2

+0−2

3

2

+0−2

3

2

+1−2

3

2

6−1

=

4

15

ρxy=cov(x,y)

σx∗σy

=

1

15

4

15×

4

15

=0.25

Jaccard:

x2=12+12+02+12+02+12=4

y2=12+12+12+02+02+12=4

X∙Y=1×1+1×1+0×1+1×0×0×0+1×1=3

ℐx,y=

xy

22

=

3

=0.6

相关文档
最新文档