字典学习

字典学习
字典学习

问题1:我们为什么需要字典学习?

回答这个问题实际上就是要回答“稀疏字典学习”中的字典是怎么来的。做一个比喻,句子是人类社会最神奇的东西,人类社会的一切知识无论是已经发现的还是没有发现的都必然要通过句子来表示出来(从某种意义上讲,公式也是句子)。这样说来,人类懂得的知识可要算是极为浩繁的。有人统计过人类每天新产生的知识可以装满一个2T(2048G)大小的硬盘。但无论有多少句子需要被书写,对于一个句子来说它最本质的特征是什么呢?毫无疑问,是一个个构成这个句子的单词(对英语来说)或字(对汉语来说)。所以我们可以很傲娇的这样认为,无论人类的知识有多么浩繁,也无论人类的科技有多么发达,一本长不过20厘米,宽不过15厘米,厚不过4厘米的新华字典或牛津字典足以表达人类从古至今乃至未来的所有知识,那些知识只不过是字典中字的排列组合罢了!直到这里,我相信相当一部分读者或许在心中已经明白了字典学习的第一个好处——它实质上是对于庞大数据集的一种降维表示。第二,正如同字是句子最质朴的特征一样,字典学习总是尝试学习蕴藏在样本背后最质朴的特征(假如样本最质朴的特征就是样本最好的特征),这两条原因同时也是这两年深度学习之风日盛的情况下字典学习也开始随之升温的原因。题外话:现代神经科学表明,哺乳动物大脑的初级视觉皮层干就事情就是图像的字典表示。

问题2:我们为什么需要稀疏表示?

回答这个问题毫无疑问就是要回答“稀疏字典学习”中稀疏两字的来历。不妨再举一个例子。相信大部分人都有这样一种感觉,当我们在解涉及到新的知识点的数学题时总有一种累心(累脑)的感觉。但是当我们通过艰苦卓绝的训练将新的知识点牢牢掌握时,再解决与这个知识点相关的问题时就不觉得很累了。这是为什么呢?意大利罗马大学的Fabio Babiloni教授曾经做过一项实验,他们让新飞行员驾驶一架飞机并采集了他们驾驶状态下的脑电,同时又让老飞行员驾驶飞机并也采集了他们驾驶状态下的脑电。如下图所示:

随后Fabio教授计算出了两类飞行员的大脑的活跃状态,如下图:

左图是新飞行员(不熟练的飞行员)的大脑。图中黄色的部分,是被认为活跃的脑区。右图是老飞行员(熟练的飞行员)的大脑,黄色区域相比左边的图有明显的减少。换言之,针对某一特定任务(这里是飞行),熟练者的大脑可以调动尽可能少的脑区消耗尽可能少的能量进行同样有效的计算(所以熟悉知识点的你,大脑不会再容易觉得累了),并且由于调动的脑区很少,大脑计算速度也会变快,这就是我们称熟练者为熟练者的原理所在。站在我们所要理解的稀疏字典学习的角度上来讲就是大脑学会了知识的稀疏表示。

稀疏表示的本质:用尽可能少的资源表示尽可能多的知识,这种表示还能带来一个附加的好处,即计算速度快。

在懂得“字典”和“稀疏”各自的那点事儿以后,我们还要再讲讲稀疏和字典共同的那点儿事。或许在大脑中“字典”和“稀疏”是两个不怎么想干的阶段,毕竟“字典”涉及初级视觉皮层,而“稀疏”涉及前额叶皮层。但是在计算机中,“字典”和“稀疏”却是一堆孪生兄弟。在学习样本字典之初的时候,稀疏条件就已经被加入了。我们希望字典里的字可以尽能的少,但是却可以尽可能的表示最多的句子。这样的字典最容易满足稀疏条件。也就是说,这个“字典”是这个“稀疏”私人订制的。

第二部分稀疏字典学习的Python实现

用Python实现稀疏字典学习需要三个前提条件

1.安装NumPy

2.安装SciPy

3.安装Python机器学习工具包sklearn

为了避免过于麻烦的安装,这里我干脆建议诸位读者安装Python的商业发行版Anaconda,内含python集成开发环境和数百个常用的python支持包。具体安装过程和使用细节参见我的博客附录D Python接口大法。

样例一:图片的稀疏字典学习

这段代码来源于Python的Dictionary Learning的官方文献教材,主要用途是教会用户通过字典学习对图片进行滤波处理。

step1:首先是各种工具包的导入和测试样例的导入

1.from time import time

2.

3.import matplotlib.pyplot as plt

4.import numpy as np

5.import scipy as sp

6.

7.from sklearn.decomposition import MiniBatchDictionaryLearning

8.from sklearn.feature_extraction.image import extract_patches_2d

9.from sklearn.feature_extraction.image import reconstruct_from_patches_2d

10.from sklearn.utils.testing import SkipTest

11.from sklearn.utils.fixes import sp_version

12.

13.if sp_version < (0, 12):

14.raise SkipTest("Skipping because SciPy version earlier than 0.12.0 and "

15. "thus does not include the scipy.misc.face() image.")

16.try:

17.from scipy import misc

18.face = misc.face(gray=True)

19.except AttributeError:

20.# Old versions of scipy have face in the top level package

21.face = sp.face(gray=True)

第1行:导入time模块,用于测算一些步骤的时间消耗

第3~5行:导入Python科学计算的基本需求模块,主要包括NumPy(矩阵计算模块)、SciPy(科学计算模块)和matplotlib.pyplot 模块(画图)。有了这三个模块,Python俨然已是基础版的Matlab。

第7~11行:导入稀疏字典学习所需要的函数,下面分行解释

第7行:导入MiniBatchDictionaryLearning,MiniBatch是字典学习的一种方法,这种方法专门应用于大数据情况下字典学习。当数据量非常大时,严格对待每一个样本就会消耗大量的时间,而MiniBatch通过降低计算精度来换取时间利益,但是仍然能够通过大量的数据学到合理的词典。换言之,普通的DictionaryLearning做的是精品店,量少而精,但是价格高。MiniBatchDictionaryLearning做的是批发市场,量大不精,薄利多销。

第8行:导入碎片提取函数extract_patches_2d。调用该函数将一张图片切割为一个一个的pitch。如果一张图片相当于一篇文章的话,那么该函数的目标就是把文章中的每个句子都找到,这样才方便提取蕴藏在每个句子中的字。图片和pitch的关系如下图所示:

整张头像的照片是个图片,通过对图片的分割可以将图片分割为一个一个的小块,也就是一个个Pitch。如果对pitch仍然不了解,只好请你看这个:https://www.360docs.net/doc/7517312111.html,/zouxy09/article/details/8775488

第9行:导入图片复原函数reconstruct_from_patches_2d,它可以通过pitch复原一整张图片。

第10行:导入测试工具nose下的异常抛出函数SkipTest

第11行:导入SciPy版本检测函数sp_version用于检测版本高低,版本低于0.12的SciPy没有我们需要的样本测试用例

第13~15行:检测SciPy版本,如果版本太低就抛出一个异常。程序运行结束

第16~21行:尝试打开样本测试用例,如果打不开就抛出一个异常。

step2:通过测试样例计算字典V

1.# Convert from uint8 representation with values between 0 and 255 to

2.# a floating point representation with values between 0 and 1.

3.face = face / 255.0

4.

5.# downsample for higher speed

6.face = face[::2, ::2] + face[1::2, ::2] + face[::2, 1::2] + face[1::2, 1::2]

7.face = face / 4.0

8.height, width = face.shape

9.

10.# Distort the right half of the image

11.print('Distorting image...')

12.distorted = face.copy()

13.distorted[:, width // 2:] += 0.075 * np.random.randn(height, width // 2)

14.

15.# Extract all reference patches from the left half of the image

16.print('Extracting reference patches...')

17.t0 = time()

18.patch_size = (7, 7)

19.data = extract_patches_2d(distorted[:, :width // 2], patch_size)

20.data = data.reshape(data.shape[0], -1)

21.data -= np.mean(data, axis=0)

22.data /= np.std(data, axis=0)

23.print('done in %.2fs.' % (time() - t0))

24.print('Learning the dictionary...')

25.t0 = time()

26.dico = MiniBatchDictionaryLearning(n_components=100, alpha=1, n_iter=500)

27.V = dico.fit(data).components_

28.dt = time() - t0

29.print('done in %.2fs.' % dt)

30.

31.plt.figure(figsize=(4.2, 4))

32.for i, comp in enumerate(V[:100]):

33.plt.subplot(10, 10, i + 1)

34.plt.imshow(comp.reshape(patch_size), cmap=plt.cm.gray_r,

35. interpolation='nearest')

36.plt.xticks(())

37.plt.yticks(())

38.plt.suptitle('Dictionary learned from face patches\n' +

39. 'Train time %.1fs on %d patches' % (dt, len(data)),

40. fontsize=16)

41.plt.subplots_adjust(0.08, 0.02, 0.92, 0.85, 0.08, 0.23)#left, right, bottom, top, wspace, hspace

第3行:读入的face大小在0~255之间,所以通过除以255将face的大小映射到0~1上去

第6~7行:对图形进行采样,把图片的长和宽各缩小一般。记住array矩阵的访问方式 array[起始点:终结点(不包括):步长] 第8行:图片的长宽大小

第12行:将face的内容复制给distorted,这里不用等号因为等号在python中其实是地址的引用。

第13行:对照片的右半部分加上噪声,之所以左半部分不加是因为教材想要产生一个对比的效果

第17行:开始计时,并保存在t0中

第18行:tuple格式的pitch大小

第19行:对图片的左半部分(未加噪声的部分)提取pitch

第20行:用reshape函数对data(94500,7,7)进行整形,reshape中如果某一位是-1,则这一维会根据(元素个数/已指明的维度)来计算这里经过整形后data变成(94500,49)

第21~22行:每一行的data减去均值除以方差,这是zscore标准化的方法

第26行:初始化MiniBatchDictionaryLearning类,并按照初始参数初始化类的属性

第27行:调用fit方法对传入的样本集data进行字典提取,components_返回该类fit方法的运算结果,也就是我们想要的字典V 第31~41行:画出V中的字典,下面逐行解释

第31行:figsize方法指明图片的大小,4.2英寸宽,4英寸高。其中一英寸的定义是80个像素点

第32行:循环画出100个字典V中的字

第41行:6个参数与注释后的6个属性对应

运行程序,查看输出结果:

step3:画出标准图像和真正的噪声,方便同之后字典学习学到的噪声相比较

1.def show_with_diff(image, reference, title):

2."""Helper function to display denoising"""

3.plt.figure(figsize=(5, 3.3))

4.plt.subplot(1, 2, 1)

5.plt.title('Image')

6.plt.imshow(image, vmin=0, vmax=1, cmap=plt.cm.gray,

7. interpolation='nearest')

8.plt.xticks(())

9.plt.yticks(())

10.plt.subplot(1, 2, 2)

11.difference = image - reference

12.

13.plt.title('Difference (norm: %.2f)' % np.sqrt(np.sum(difference ** 2)))

14.plt.imshow(difference, vmin=-0.5, vmax=0.5, cmap=plt.cm.PuOr,

15. interpolation='nearest')

16.plt.xticks(())

17.plt.yticks(())

18.plt.suptitle(title, size=16)

19.plt.subplots_adjust(0.02, 0.02, 0.98, 0.79, 0.02, 0.2)

20.

21.show_with_diff(distorted, face, 'Distorted image')

程序输出如下图所示:

step4:测试不同的字典学习方法和参数对字典学习的影响

1.print('Extracting noisy patches... ')

2.t0 = time()

3.data = extract_patches_2d(distorted[:, width // 2:], patch_size)

4.data = data.reshape(data.shape[0], -1)

5.intercept = np.mean(data, axis=0)

6.data -= intercept

7.print('done in %.2fs.' % (time() - t0))

8.

9.transform_algorithms = [

10.('Orthogonal Matching Pursuit\n1 atom', 'omp',

11. {'transform_n_nonzero_coefs': 1}),

12.('Orthogonal Matching Pursuit\n2 atoms', 'omp',

13. {'transform_n_nonzero_coefs': 2}),

14.('Least-angle regression\n5 atoms', 'lars',

15. {'transform_n_nonzero_coefs': 5}),

16.('Thresholding\n alpha=0.1', 'threshold', {'transform_alpha': .1})]

17.

18.reconstructions = {}

19.for title, transform_algorithm, kwargs in transform_algorithms:

20.print(title + '...')

21.reconstructions[title] = face.copy()

22.t0 = time()

23.dico.set_params(transform_algorithm=transform_algorithm, **kwargs)

24.code = dico.transform(data)

25.patches = np.dot(code, V)

26.

27.patches += intercept

28.patches = patches.reshape(len(data), *patch_size)

29.if transform_algorithm == 'threshold':

30.patches -= patches.min()

31.patches /= patches.max()

32.reconstructions[title][:, width // 2:] = reconstruct_from_patches_2d(

33.patches, (height, width // 2))

34.dt = time() - t0

35.print('done in %.2fs.' % dt)

36.show_with_diff(reconstructions[title], face,

37. title + ' (time: %.1fs)' % dt)

38.

39.plt.show()

第3行:提取照片中被污染过的右半部进行字典学习。

第10~16行:四中不同的字典表示策略

第23行:通过set_params对第二阶段的参数进行设置

第24行:transform根据set_params对设完参数的模型进行字典表示,表示结果放在code中。code总共有100列,每一列对应着V中的一个字典元素,所谓稀疏性就是code中每一行的大部分元素都是0,这样就可以用尽可能少的字典元素表示回去。

第25行:code矩阵乘V得到复原后的矩阵patches

第28行:将patches从(94500,49)变回(94500,7,7)

第32行:通过reconstruct_from_patches_2d函数将patches重新拼接回图片

该程序输出为四中不同转换算法下的降噪效果:

字典学习。比如一个向量,是k维的,我现在有一个k*n的字典,其中n>>k,所谓的字典学习,就是在这包含n个向量的字典当中寻找一个线性表示可以表示出当前这个k维的向量。

世界著名英语词典

牛津词典系列 牛津辞典是英国牛津大学出版社出版的多种英语词典的统称,是英国语言词典的代表。牛津词典详细追溯了每个英语词的历史演变(对其最早的出现年代有明确的标注),释义和引证繁富,因而是英语词汇的最高权威。 牛津老大 The Oxford English Dictionary,20 Volume Set《牛津英语大辞典》【查早到1150年(的古旧词)】类似《汉语大词典》 牛津老大:最高级的牛津词典,就是The Oxford English Dictionary(20 Volume Set)简称OED,这是牛津兄弟的老大,也是英语词典界的圣经。它一共有20卷,目前国内书商动辄索价¥20000RMB。这么贵的词典谁会买呢?问得好。其实,没有任何人能够读完这本词典,它的存在更具有象征意义,象征着人类对知识无限的追求。 然而人类的这点成就这一切,在电子时代失去了骇人的体量和质感。OED的光盘版,只需要两张CD-ROM。但凡买过这套电子版的人,无不怨声载道,因为它的接口设计实在太差了。查完一个词之后,居然没有一个后退键。只能用鼠标浏览,但又不支持鼠标右键的COPY和粘贴。总之,如果花钱买来的话,大概会非常痛苦。 顺便说一句,The Oxford English Dictionary(20 Volume Set)有个缩印版,The Compact Oxford English Dictionary,内容跟OED一样,价格只要¥3200,但字体非常恐怖,是把OED四页的内容印到一页上,如果你不想写一部失乐园续集的话,最好还是打消买它的念头。 牛津老二 The New Shorter Oxford English Dictionary,2 Vol.Set《牛津简编英语词典》【查早到17世纪(的古旧词)】类似《辞源》 牛津老二:The New Shorter Oxford English Dictionary (2 Vol. Set),可能是牛津也觉得自己浪费森林太不象话,于是出了一个简编版。不要以为看到Shorter,就真Shorter,其实,这是牛津家族中第二大的词典。两大本3888页的厚度,也够意思了。这本词典在国内由上海外语教育出版社引进第五版。网上可以找到供Mdict词典软件使用的牛津简编词典包。 牛津老三 The New Oxford Dictionary of English《新牛津英语大词典》【查现代的(百科新词)】类似《辞海》 该词典国内已经出版了,双解版名为《新牛津英汉双解大词典》(上海外语教育出版社),在网上也要卖¥315左右。如果OED和SOED侧重词源学,引经据典太多,太学术的话,那么ODE就是给人类预备的。不过这本词典的中文翻译挺讨厌,因为把每个例句都翻译了,包括:“Yes,I will.” 这样的。如果你想拥有一本英英的原版,先不要急着去亚马逊下单,下面有一个终极解决办法,金山词霸2009[牛津版]收录其双解版。 牛津老四 Concise Oxford Dictionary《牛津简明英语词典》【查现代的(英文新词)】类似《现代汉语词典》 该词典是大学级别词典(College Dictionary),中高级用用也足够了,简称COD。由外语教学与研究出版社引进。

最全的俄罗斯网上词典

史上最全最雷人的俄语词典大公开!!!!!! 懒人词典 ,在线词典 ,在线词典 多语种、多学科在线词典 在线俄语原文词典 网络俄语原文百科大词典 ,rambler搜索引擎词典 俄语原文俚语词汇 在线俄英词典 在线词典 俄英俚语词典 在线词典 http://feb-web.ru/feb/mas/MAS-abc/default.asp在线俄语词典 在线俄语词典 俚语词汇 AV词典 超全的有关人体的词汇大汇总,左侧栏内是单词列表,右侧是对该词的全方位解释 石油天然气词汇 俄语搜索引擎 俄语搜索引擎 俄语在线词典 俄英词典 Глоссарий телекоммуникационных терминов http://alom.ru/modules/news/print.php?storyid=61&r=%D0%A0%D0%B0%D0%B7%D0%BD%D0%BE%D0 %B5&PHPSESSID=b01243077903661c a0a5dd2c96e01d3f ТЕХНИЧЕСКИЕ АББРЕВИАТУРЫ (английские) Часть 2. (D-I) 网络术语英俄词典 http://www.chem.isu.ru/leos/base/glossary1.html Глоссарий терминов,используемых в органической и физической органической химии http://www.briztel.ru/support/dictionary/english.htm英俄通信词汇 http://www.briztel.ru/support/dictionary/russian.htm俄语原文通信词汇 俄英谚语对照版 飞行器词汇英俄版 通信词汇英俄版 通信词汇俄语原文版 英俄在线词典 http://slovari.yandex.r u/search.xm l?text=enc_abc&enc_abc=*&how=enc_abc_rev&encpage=abramov Словарь русских синонимов и сходных по смыслу выражений. Автор Н. Абрамов http://www.stugna.kiev.ua/print.php?pirs=other&st=dictionaryАнгло-Русский словарь яхтенных терминов.

网上在线字典辞典大全

网上在线字典辞典大全 翻译类字典辞典 金山词霸在线版——国人自主开发的最权威的电子词典,词霸搜索-免费在线词典查词翻译_英汉_日汉_英语_成语 中国专家翻译网——英文翻译公司--日文翻译公司--多语种翻译公司- 英语翻译--日语翻译——德语翻译——法语翻译 中国译典@中国在线翻译网——线上最庞大的英汉-汉英翻译语料库 百度词典搜索——百度词典搜索支持强大的英汉互译功能,中文成语的智能翻译 Y ahoo学生英汉字典——英语单词查询、举例 Dict_CN 在线词典——在线搜索不重复汉英词条100万,英汉词条103万。 牛津英汉双解词典 在线汉英双解新华字典 林语堂当代汉英词典(繁)——较权威的在线汉英词典,繁体,备有汉字部首索引和汉语拼音检索功能华翼翻译-多语种在线电脑字典 太阳雨英汉\汉英词典汉语输入方式:拼音、简体繁体 洪恩双语词典中英文查询,提供词义、例句、词组、同义词、反义词 英文类字典辞典 Y https://www.360docs.net/doc/7517312111.html,——几十个语种和数百本词典的在线检索,最权威的在线词典门户之一,英文界面LEO English-German Dictionary——英文、德文互译在线词典,英文界面 Dnelook Dictionary——英语、法语、德语、意大利语五种语言629本词典的在线检索,权威,英文Latin-English Dictionary——在线拉丁语和英语词典,历史较久,英文界面 Webster's Collegiate Dictionary——著名的韦氏大词典在线版,使用方便,英文 American Sign Language Dictionary——美国形体语言词典,独特的在线词典 剑桥在线辞典——包括剑桥国际英语辞典、美国英语辞典、国际短语辞典及国际习语辞典,英文https://www.360docs.net/doc/7517312111.html,——查询、互译、流行词汇、站点导航,英文 https://www.360docs.net/doc/7517312111.html,——英语同义词字典,英文 Y https://www.360docs.net/doc/7517312111.html,几十个语种和数百本词典的在线检索,最权威的在线词典门户之一,英文界面 LEO English-German Dictionary英文、德文互译在线词典,英文界面 Onelook Dictionary 英语、法语、德语、意大利语五种语言629本词典的在线检索,权威,英文 Latin-English Dictionary在线拉丁语和英语词典,历史较久,英文界面 Travlang's Translating Dictionaries欧洲主要语言互译,很多链接资源,英文 American Sign Language Dictionary美国形体语言词典,独特的在线词典 Oxford English Dictionary 牛津英语大词典在线版,须注册才能使用,英文 剑桥在线辞典包括剑桥国际英语辞典、美国英语辞典、国际短语辞典及国际习语辞典,英文 https://www.360docs.net/doc/7517312111.html,英语同义词字典,英文 其它语言类字典辞典 德汉字典网 华翼电脑字典-荷兰语、中文、英语、法语、... 承隆科技Amasoft 在线、离线英汉翻译软件,英汉/汉英字典 颜元叔教授主编-网路英英/英汉辞典 https://www.360docs.net/doc/7517312111.html,提供英文对英文、中文和日文的翻译。 纳西东巴象形文字纳汉在线字典- 提供汉字与东巴象形文字在线翻译工具。 线索中国- 网上字典 Robert Beard's List of On-line Dictionaries收集了网络上各种在线语言字典。

【CN109978064A】基于图像集的李群字典学习分类方法【专利】

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910248531.5 (22)申请日 2019.03.29 (71)申请人 苏州大学 地址 215000 江苏省苏州市相城区济学路8 号 (72)发明人 王邦军 熊啸东 李凡长 张莉  (74)专利代理机构 苏州市中南伟业知识产权代 理事务所(普通合伙) 32257 代理人 郭磊 (51)Int.Cl. G06K 9/62(2006.01) (54)发明名称 基于图像集的李群字典学习分类方法 (57)摘要 本发明公开了一种基于图像集的李群字典 学习分类方法。本发明一种基于图像集的李群字 典学习分类方法,包括:用P=[p 1,p 2,...,p n ]表 示一个包含n样本的图像集;每个p i 是一个一维 向量,代表该图像集中的一个图像;使用协方差 矩阵S来表示图像集: 是图像的平均值向量;由于图像集的样本数量通 常小于图像的维数,因此矩阵在某些情况下有可 能不是正定矩阵;添加一个扰动项λ来解决这个 问题。本发明的有益效果:通过将图像集描述为 SPD矩阵,使得每个图像集对应于SPD李群上的元 素,不仅保留图像集的主要信息,还将基于图像 集的分类问题转换为线性分类问题。权利要求书3页 说明书12页 附图2页CN 109978064 A 2019.07.05 C N 109978064 A

1.一种基于图像集的李群字典学习分类方法,其特征在于,包括: 用P=[p 1,p 2,...,p n ]表示一个包含n样本的图像集;每个p i 是一个一维向量,代表该图像集中的一个图像; 使用协方差矩阵S来表示图像集: 是图像的平均值向量;由于图像集的样本数量通常小于图像的维数,因此矩阵在某些情况下有可能不是正定矩阵;添加一个扰动项λ来解决这个问题: S *=S+λI 得到log - Euclidean度量: 因此,使用对数运算将所有元素 映射到切线空间 进行降维处理: 假设图像集数据中心化的低维表示为A;假定A的内积矩阵表示为Z,Z=A T A因此:dist ij 2=||a i ||2+||a j ||2-2a i T a j =z ii +z jj -2z ij 将dist i.2dist .j 2 dist ..2 假定为: 因此, 有如下推论: 现在使用距离矩阵D来计算内积矩阵Z; 对Z进行特征值分解:Z=VΛV T ,其中Λ=diag(λ1,λ2,...,λd )是由特征值构造的对角矩阵,并且,λ1≥λ2≥...≥λd ; V则是与Λ对应的特征向量矩阵; 因此:选择前d ′个最大的特征值, 构成新的特征值矩阵 并且将与这d ′个最大的特征值相关联的特征向量构成和新的特 征向量矩阵 然后得到: 在前一过程之后,获得图像集的低维表示,并保存了图像集的主要信息;然后应用FDDL 模型对样本的低维表示进行分类;FDDL(带费舍尔判别准则的字典学习模型)通过创建一个结构化的字典来进行分类; 用A=[A 1,A 2,...,A c ]表示为训练集,其中A i 是来自第i类的训练样本的子集;X是用字典D来表示训练集A的系数矩阵,也就是A≈DX;同样可以将D按照所属类别进行区分:其中X i 是X中用于表示数据A i 的子系数矩阵;所以,系数矩阵X可以表示成:X=[X 1,X 2,...,X c ]; 权 利 要 求 书1/3页2CN 109978064 A

一个有效的科技翻译操作模式 - 上海交通大学翻译与词典学

一个有效的科技翻译操作模式 ———谈制约科技英汉翻译成功的几种关键技巧 ○冷冰冰 (上海理工大学外语学院,上海 200093) [摘 要] 科技翻译是非文学翻译的一种重要实用文体。本文依据法国达尼尔?吉尔的翻译序列模式,对科技英汉翻译实践的四个步骤———建立意义假设、对意义假设进行合理化检查、重新表达及核对译文忠实性,进行了技巧上的探讨,指出考虑到目前科技翻译教学的对象及科技文本的特点,科技翻译教学应强调查找相关背景知识的重要性,并提出把握科技英语修辞特点和英汉语言差异对翻译教学的成功起着至关重要的作用。 [关键词] 科技翻译; 达尼尔?吉尔的翻译序列模式; 背景知识 中图分类号:H315.9 文献标识码:A 文章编号:1672-8610(2009)11-0080-03 随着全球化进程的加快和大学生英语水平的普遍提高,理工科大学的公共英语改革在不断深化,开展科技英语翻译教学引起了教学者的广泛关注。从近年来发表的教学论文来看,关于科技翻译教学理念的确立、课程内容的选择和实施等方面的文章为数不少,这些论文为科技翻译学科的建立打下了基础,但就翻译技能的培养来说,教师们面对的相当多的文章或是教材却仍缺乏语言学理论指导,多从句法角度、按传统翻译方法进行译例堆砌,重结果轻过程,教学实用性不强。笔者通过本校大学英语科技翻译的教学实践认识到:将科技翻译的过程仍锁定在传统大学翻译的“理解、表达和校改”三个阶段,不突出查找背景知识的重要性, 势必会使许多不懂专业的译者望而却步;而事实证明译者是一个杂家,许多不懂专业的译者经多年的翻译实践后会成长为该专业出色的译员。 本文将从法国翻译学教授达尼尔?吉尔(Daniel Gile)的翻译序列模式出发,详细谈谈在科技翻译教学中如何借助背景知识运用该模式进行四个步骤的教学。 一、达尼尔?吉尔的翻译序列模式 该翻译序列模式把翻译形式化,使之成为一系列处理“翻译单位”的循环过程,每个过程都必须检验并作出决定,都必须调动语言知识和语言外知识(背景知识)。下图所示: 根据图所示,在进行科技翻译实践时,首先,译者从阅读翻译单位、对其所涵盖的意义作出假设入手;如果缺乏足够的知识来建立一个假设,译者便查找书面材料或咨询相关人士,如果建立的这个假设不理想,译者就会作出另一个意义假设并检查其可行性。其次,一旦找到一个可行的意义假设,译者就进入再表达阶段。在这一阶段,首先要用译语组织一个与翻译单位意义相符的语句。如果译者由于语言知识和语言外知识不足,无法完成这一步,他就搜集相关信息。最后,语句完成后,还要检查语言是否规范,是否忠于原文。 基于这一模式,对一个翻译单位所进行的翻译过程应包括:1.建立意义假设;2.对意义假设进行合理化检查;3.重新表达;4.核对译文忠实性四个步骤。 二、科技翻译的四个必要步骤 (一)建立意义假设 根据达尼尔?吉尔的翻译序列模式,阅读翻译单位,建立一个意义假设,这是翻译的第一步。在这个阶段中我们至少需要考虑两个问题:1.恰当的翻译单位;2.借助语言外知识建立意义假设的必要性。 1.恰当的翻译单位。关于科技语篇的翻译单位问题许 语文学刊?外语教育教学 2009年第11期 [作者简介]冷冰冰,上海理工大学外语学院讲师,研究方向:专门用途英语、科技翻译。

字典学习

问题1:我们为什么需要字典学习? 回答这个问题实际上就是要回答“稀疏字典学习”中的字典是怎么来的。做一个比喻,句子是人类社会最神奇的东西,人类社会的一切知识无论是已经发现的还是没有发现的都必然要通过句子来表示出来(从某种意义上讲,公式也是句子)。这样说来,人类懂得的知识可要算是极为浩繁的。有人统计过人类每天新产生的知识可以装满一个2T(2048G)大小的硬盘。但无论有多少句子需要被书写,对于一个句子来说它最本质的特征是什么呢?毫无疑问,是一个个构成这个句子的单词(对英语来说)或字(对汉语来说)。所以我们可以很傲娇的这样认为,无论人类的知识有多么浩繁,也无论人类的科技有多么发达,一本长不过20厘米,宽不过15厘米,厚不过4厘米的新华字典或牛津字典足以表达人类从古至今乃至未来的所有知识,那些知识只不过是字典中字的排列组合罢了!直到这里,我相信相当一部分读者或许在心中已经明白了字典学习的第一个好处——它实质上是对于庞大数据集的一种降维表示。第二,正如同字是句子最质朴的特征一样,字典学习总是尝试学习蕴藏在样本背后最质朴的特征(假如样本最质朴的特征就是样本最好的特征),这两条原因同时也是这两年深度学习之风日盛的情况下字典学习也开始随之升温的原因。题外话:现代神经科学表明,哺乳动物大脑的初级视觉皮层干就事情就是图像的字典表示。 问题2:我们为什么需要稀疏表示? 回答这个问题毫无疑问就是要回答“稀疏字典学习”中稀疏两字的来历。不妨再举一个例子。相信大部分人都有这样一种感觉,当我们在解涉及到新的知识点的数学题时总有一种累心(累脑)的感觉。但是当我们通过艰苦卓绝的训练将新的知识点牢牢掌握时,再解决与这个知识点相关的问题时就不觉得很累了。这是为什么呢?意大利罗马大学的Fabio Babiloni教授曾经做过一项实验,他们让新飞行员驾驶一架飞机并采集了他们驾驶状态下的脑电,同时又让老飞行员驾驶飞机并也采集了他们驾驶状态下的脑电。如下图所示: 随后Fabio教授计算出了两类飞行员的大脑的活跃状态,如下图:

各种在线词典网站

英汉类字典词典 ?金山词霸2007在线版——国人自主开发的最权威的电子词典,免费在线字典词典,查词翻译_英汉_日汉_英语_成语 ?百度词典搜索——百度词典搜索支持强大的英汉互译功能,中文成语的智能翻译 ?google语言工具——在线多国语言互译,功能强大 ?https://www.360docs.net/doc/7517312111.html, 在线翻译字典——在线搜索不重复汉英词条100万,英汉词条103万。 ?爱词霸在线翻译——提供在线词典查询,包含覆盖70多个专业的近百本词典数据,超过1000万词条 ?Yahoo!字典(雅虎中国) ?Yahoo!字典(雅虎香港) ?Yahoo!奇摩字典(台湾) ?牛津英汉双解词典——界面简单而实用 ?顏氏美語(繁体)——颜元叔教授主编-网路英英/英汉辞典 ? ?中国专家翻译网——英文翻译公司--日文翻译公司--多语种翻译公司- 英语、日语、德语、法语翻译 ?中国译典@中国在线翻译网——线上最庞大的英汉-汉英翻译语料库 ?金桥翻译中心——支持多国语言在线翻译

?词博词典——词汇量超过网上其他任何一款词典,搜索结果多元化 ?通联免费在线翻译——免费多语种在线翻译 ?Free Website Translator——Online Website Translation 网页翻译 ?汉英类字典词典 ?中国知网英汉-在线汉英词典 ?林语堂当代汉英词典(繁)——较权威的在线汉英词典,繁体,备有汉字部首索引和汉语拼音检索功能 ?华翼翻译-多语种在线电脑字典——中文,英语,荷兰语,德语,法语,西班牙语,瑞典语,匈牙利语 ?太阳雨英汉\汉英词典——汉语输入方式:拼音、简体繁体 ?洪恩双语词典——中英文查询,提供词义、例句、词组、同义词、反义词 ?英文类字典词典 ?韦氏英语辞典 ?English Dictionary from freesearch_co_uk——例句不错 ?LEO English-German Dictionary——英文、德文互译在线词典,英文界面 ?Wordsmyth——美国英语,有难易之分 ?Latin-English Dictionary——在线拉丁语和英语词典,历史较久,英文界面

网上在线翻译字典词典大全

网上在线翻译字典词典大全 翻译类字典词典 英汉类字典词典 ?百度词典搜索——百度词典搜索支持强大的英汉互译功能,中文成语的智能翻译?google语言工具——在线多国语言互译,功能强大 ?https://www.360docs.net/doc/7517312111.html, 在线翻译字典——在线搜索不重复汉英词条100万,英汉词条103万。 ?爱词霸在线翻译——提供在线词典查询,包含覆盖70多个专业的近百本词典数据,超过1000万词条 ?Yahoo!字典(雅虎中国) ?Yahoo!字典(雅虎香港) ?Yahoo!奇摩字典(台湾) ?牛津英汉双解词典——界面简单而实用 ?顏氏美語(繁体)——颜元叔教授主编-网路英英/英汉辞典 ? ?Google 翻译——目前网上最好的翻译工具 ?中国译典@中国在线翻译网——线上最庞大的英汉-汉英翻译语料库 ?金桥翻译中心——支持多国语言在线翻译 ?词博词典——词汇量超过网上其他任何一款词典,搜索结果多元化 ?通联免费在线翻译——免费多语种在线翻译 ?Free Website Translator—— Online Website Translation 网页翻译 汉英类字典词典 ?中国知网英汉-在线汉英词典 ?林语堂当代汉英词典(繁)——较权威的在线汉英词典,繁体,备有汉字部首索引和汉语拼音检索功能 ?华翼翻译-多语种在线电脑字典——中文,英语,荷兰语,德语,法语,西班牙语,瑞典语,匈牙利语 ?太阳雨英汉\汉英词典——汉语输入方式:拼音、简体繁体 ?洪恩双语词典——中英文查询,提供词义、例句、词组、同义词、反义词 英文类字典词典 ?韦氏英语辞典 ?English Dictionary from freesearch_co_uk——例句不错

利用有道词典学好英语的方法

利用有道词典学好英语方法 我相信现在大家都有手机了!但是大家都用手机来干嘛?玩游戏?聊天?看视频?听音乐?到考四六级以及其他的英语考试的时候,就后悔了!浪费时间!浪费青春! 想利用手机真正的学好英语?身处于移动互联网爆发的时代,各种智能手机泛滥。你有两种选择,要么被互联网巨大的数据洪流冲刷,迷失自我。另外一种选择,借助互联网强大的优势提高自己! 那到底如何借助手机、选择什么样的方式才能最有效的提高英语水平?想必,这是大家最想知道的答案!而我亲身经历过得到的答案是,返璞归真,别再去找一大堆资料来让自己迷失,找到一款最适合学习的词典软件才是最重要的,当然也是英语学习所必须的。 那如何选择词典软件以及如何通过手机词典软件提高自己的英语?我曾经下载过互联网所有的词典软件,以及收集了所有的在线词典、在线翻译。因为我是读国贸出身的,对英语交流、商务英语、专业英语以及英语考试、邮件都是我要面对的英语方面的问题。我下载了所有的词典软件,最后只留下了“有道词典”,现在我也有手机、平板了。也都下载了!为什么?原因很简单,“有道词典”提供的词库不仅量大,而且内容非常精确,排版非常清晰,还有讲解、双语释义、词性说明等等的内容!还有最重要的一点,如果想随时随地巩固、复习,手机词典就能帮上大忙! 如何利用有道词典学翻译 翻译不是一朝一夕就能轻松学到的东西,它需要理论和实践的相结合。仅仅学习翻译理论而没有翻译实践,翻译就变成了一个空架子;仅仅追求翻译的量(所谓的翻译实践)而不学习任何翻译理论,就会使翻译出来的文字毫无章法。我在这里介绍的利用词典学翻译,并不是研究深层次的翻译,而是要通过词典来学习英语国家的人更地道、更标准的说话方式,这些是我们非英语国家的人学习英语时需要达到的一个较高境界。 我在abc360上课的时候,因为刚开始学,基础不好,词汇量少,直接和外教交流很困难,那时候的老师有教我用词典学英语。方法真心不错。“利用词典学单词”要“小词大用”,其实所谓的“小词大用”说白了就是学活单词,用看似“没什么意思”的单词去表达一个有意义的句子。比如让大家来翻译这样一个句子,其实也是我们日常生活中经常使用的一句话:她正在整理房间。估计大家看到这个句子,就会很自然地把“整理”作为一个翻译的突破点,在考虑到用clean up还是tidy up?实在伤脑筋。但是转而一想,如果用这个句子如何:She is doing the room ?一个小词“do”,就把我们的大问题轻松解决掉了,实在很神奇。这样翻译出来的句子不仅简单,而且地道。用这个方法,渐渐的和abc360的外教交流越来越顺利了,刚开始很依赖有道词典,现在偶尔会用一下,外教还总是夸我用词很地道,我想还是要感谢,刚开始学的时候,用对了方法,用了有道词典吧。 在我看来,与其把词典看成一个工具、需要的时候才查查词,不如把词典当成一个很好的教材,有空的时候就拿出来学一学。通过一段时间的学习,你的英语会越来越地道,就像我一样,连abc360的外教都夸我了不是,哈哈。你会发现原来一个好的词典软件中包含的内容和信息很多很多,也许将收获到写作、阅读、语言学等其他方面的知识。

翻译学词典术语

1.绝对翻译。Absolute Translation。按照古阿德克的解释,指专业译员为应付不同翻译要求而采用的七种翻译类型之一。According to Gouadec,one of 7 types of translation which can be used by professional translators to respond to the various translation requirements 2.摘要翻译。Abstract Translation古阿德提出的用以对付不同翻译要求的七种翻译策略之一。One of seven strategies proposed by Gouadec to fulfil the various translation needs which arise in a professional environment。 3.滥译。Abusive Translation。路易斯用来表示文学翻译中极端做法的一个术语。A term used by Lewis to refer to a radical approach to literary translation。 4.可接受性。Accetability。图里采用的术语,用来指可以从翻译作品中观察到的两种倾向之一。A term used by Toury to denote one of two tendencies which can be observed in translated texts。 5.准确。Accuracy。翻译评估中用来表示译文与原文相符程度的术语。A term used in translation evaluation to refer to the extent to which a translation matches its original。 6.改编Adaptation。传统上用来指采用特别自由的翻译策略而做出任何目标文本的术语。A term traditionally used to refer to any TT in which a particularly strategy has been adopted。 7.充分性。Adequacy。某些译评者讨论源文本与目标文本关系属性时所采用的术语。A term used by some commentators on translation to discuss the nature of the relationship between ST and TT,.按照图里的解释,指翻译过程中与规范相关的连续体的两极之一。According to Toury ,one of the two poles of the continuum relates to the NORMS used in the translation process。 8.调整。Adjustment。。按照奈达的解释,指《圣经》翻译中使用的一套技巧,旨在于目标语中“产生正确的对等形式”,以帮助译文达至动态对等。According to Nida,a set of techniques used in Bible translation which are designed to “produce correct equivalents”in TL and thus help a translation achieve dynamic equivalences 9.美学诗体翻译。Aesthetic-Poetic Translation:按照卡塞格兰德的解释,指四种翻译类型之一。According to Casagrande ,one of four types of translation。 10.经纪人Agent。塞杰用来指“处于译者与译品最终使用者中间位置”之人的术语。A rerm used by Sager to the person who is “in an intermediary position between a translator and an end user of a translation。” 11.国际会议口译联合会。AIIC(AssoicationIternationale Iterpretes de Conference).为包含会议口译员利益而成立于1953年11月的组织。An organization founded in November 1953 to protect the interests of conferences interpreters. 12.类同形式。Analogical form。按照霍姆斯的解释,译者在翻译诗体形式时可以采用的四种途径之一。According to Holmes,one of four approaches which a traslator may use when translating verse form。 13.分析。Analysis。奈达与泰伯用来描述翻译过程三步骤之中第一步的术语。A term used by Nida&Taber to describe the first of the three stages of the translation process。 14.应用翻译学,应用翻译研究。Applied translation studies。霍姆斯提出的翻译研究领域,与翻译研究中的理论研究及描写翻译研究相对应(后两者构成纯翻译研究)。The area of investigation within translation studies constrasted by Holmes with theoretical and descriptive translation studies(the two of which together make up the field of pure translation studies)

英语学习必用:手机在线电子词典推荐

英语学习必用:手机在线电子词典推荐 学英语,遇到不会的单词怎么办?翻字典?但将一本厚厚的字典时时带在身边并不现实,那怎么办呢?不怕,今天小编就给大家推荐几款可以“时时带在身边”的字典! 今天给大家推荐的词典,适用于广大英语学习和留学备考人士。本文按照词典本身的难度由高到低依次进行介绍,注意根据自身情况选择合适的词典哦。 第一本:Merriam-Webster’s Collegiate?Dictionary Merriam-Webster’s Collegiate?Dictionary,即《韦氏大学词典》。 介绍:本书收录了英语中最常用的词汇,涉及科学、技术、商业和医药方面。词条释义简明精确。本书以它的权威性和实用性成为广大英语工作者和学习者的必备工具书。GRE备考必备,该字典是ETS官方指定的推荐书目,GRE考试中单词的释义是以该书为基准的。 优点:词义精准,具有权威性和实用性。 适用对象:英语学习和GRE备考

第二本:The American Heritage?Dictionary The American Heritage?Dictionary,即《美国传统词典》。 介绍:该词典具有强大的英英解释功能,它在美国国内是非常权威的辞典,曾被https://www.360docs.net/doc/7517312111.html, 评为“编辑选择的参考工具”,是专业英语工作者必不可少的重要工具,也是广大英语爱好者的良师益友,具有非常高的权威性。 优点:地道、正统的美国传统用法,非常适用于北美考试,较《韦氏大学词典》难度低些。 适用对象:英语学习和GRE备考 第三本:Collins COBUILD Advanced Learner’s English Dictionary Collins COBUILD Advanced Learner’s English Dictionary,即《柯林斯高级英语学习词典》。

巧用词典学英语

巧用词典学英语 如今英语学习方面的书籍可谓品种繁多,要想找一本适合各种英语水平的人的辅导书不是一件容易事。不过,我们手边就有这样一种书,不仅适合各种层次的英语学习者,而且准确、实用,这就是英语词典。 说到词典,任何学习英语的人手边至少会有一本,但今天介绍的“巧用词典学英语”,要推荐使用这样几本词典:《牛津高阶英汉双解词典(第六版)》、由上海交通大学出版社出版、吴光华主编的《汉英大词典(第二版)》以及The Merriam-Webster Dictionary of Synonyms and Antonyms(韦氏的同 义词、反义词词典)。该如何有效使用这几本词典从而达到英语学习的目的呢?我们除了单词到底还能从中学到什么其他东西吗?下面我就把自己从英语学习以及教学中收获到的一些想法与大家分享一下。 1.利用词典学单词 学习单词,不仅仅是我们为了应试而使用的“背单词”,学单词首先要知道单词的读音、词性、主要中文意思,更深层次的还要去了解单词的用法(包括单复数、分词是否是特殊形式、通常如何用在句子中、是否是旧式用法(即现代英语不常用)、是否是书面语或者口语用法等等)。这里就不得不提到《牛津高阶英汉双解词典(第六版)》(以下简称牛津高阶)了。牛津高阶的优点在于它是一部英汉双解词典,而且具有较高的权威性。学习一个单词,首先我们可以通过牛津高阶给出的音标而掌握这个单词的美式发音或者英式发音;其次可大致了解这个词可做哪些词性用,如:about这个词,就有副词、介词和形容词三种词性,而通过了解词性,就有利于我们掌握这个词在句子中的具体用法;第三,了解在不同的词性下,这个单词的具体的中英文的解释及用法,还是以about为例,当它做副词使用时,通常有“大约”、“凌乱地”、“闲着、无所事事”、“附近”等7种具体的用法,作为介词时也有“关于”、“目的是、为了”、“从事于”等9种用法,而about作为形容词时,一般只出现在习语be about to do sth(即将、将要做某事)和not be about to do sth(不愿做某事)中。这样一来,

推荐书籍与词典(英译汉)

对英译汉有用的书籍和词典 书籍: 1.《英汉对比研究》连淑能高等教育出版社1993年 2.《翻译新论与实践》方梦之青岛出版社1999年6月 3.《因难见巧——名家翻译经验谈》金圣华黄国彬中国对外翻译出 版公司1998年8月 4.《文学翻译原理》张今河南大学出版社1987年9月 5.《翻译漫谈》庄译传 6. 《名作精译——《中国翻译》英译汉选萃》杨平主编青岛出版社 2005年3月 7. 《大学英汉、汉英翻译教程》卢红梅主编科学出版社 8.《翻译美学》毛荣贵著上海交通大学出版社2005年11月 9.《新世纪大学英汉翻译教程》毛荣贵著上海交通大学出版社2007 年7月 10, 《‘韩素音青年翻译奖’竞赛作品与评析》译林出版社2008年10月 11, 《译艺:英汉双向笔译》陈文伯编著群言出版社2008年3月 词典: 根据多年学习英语和翻译的习惯,大学英语专业的学生应该至少拥有三部中型词典,一本英英词典,一本英汉词典,一本汉英词典。就现有的工具书看,英汉词典可以选择陆谷孙主编的《英汉大辞典》,上海译文出版社出版。英英词典可以从英国出版的: A.The New Oxford Dictionary of English

B.The Concise Oxford Dictionary C.Longman Dictionary of Contemporary English D.Collins English Dictionary E.Shorter Oxford English Dictionary 以及美国出版的: A.The American Heritage Dictionary of the English Language B.Webster’s New Collgiate Dictionary of the English Language C.Webster’s New World Dictionary of the American English 等词典中选择一种。另外,最具权威的大型英英词典是美国出版的Webster’s Third New International Dictionary of the English Language. 汉英词典:《汉英词典》外语教学与研究出版社,商务印书馆 杂志: 《中国翻译》,《英语世界》,《科技英语学习》 出版社: 中国对外翻译出版公司,湖北教育出版社,外语教学与研究出版社,外文出版社,上海译文出版社,译林出版社 关于翻译的论文集: 1.《巴蜀译论》四川人民出版社赵洪定主编 2.《译学论集》译林出版社张柏然许均主编 3.《翻译批评论》重庆大学出版社姜治文文军主编 4.《翻译论集》(上、下集)罗新璋主编 5.《翻译新论》湖北教育出版社刘学云杨自俭主编

最全的俄语在线字典

懒人词典 ,在线词典 ,在线词典 多语种、多学科在线词典 在线俄语原文词典 网络俄语原文百科大词典 ,rambler搜索引擎词典 俄语原文俚语词汇 在线俄英词典 在线词典 俄英俚语词典 在线词典 http://feb-web.ru/feb/mas/MAS-abc/default.asp在线俄语词典 在线俄语词典 俚语词汇 AV词典 超全的有关人体的词汇大汇总,左侧栏内是单词列表,右侧是对该词的全方位解释 石油天然气词汇 俄语搜索引擎 俄语搜索引擎 俄语在线词典 俄英词典 Глоссарий телекоммуникационных терминов http://alom.ru/modules/news/print.php?storyid=61&r=%D0%A0%D0%B0%D0%B7%D0%BD%D0%BE% D0%B5&PHPSESSID=b01243077903661ca0a5dd2c96e01d3f ТЕХНИЧЕСКИЕ АББРЕВИАТУРЫ (английские) Часть 2. (D-I) 网络术语英俄词典 http://www.chem.isu.ru/leos/base/glossary1.html Глоссарий терминов,используемых в органической и физической органической химии http://www.briztel.ru/support/dictionary/english.htm英俄通信词汇 http://www.briztel.ru/support/dictionary/russian.htm俄语原文通信词汇 ********************* 俄英谚语对照版 飞行器词汇英俄版 通信词汇英俄版 通信词汇俄语原文版

相关文档
最新文档