课程目录
NLP的应用
完成学习
<style type="text/css"> </style> <!--style type="text/css"> /* Overrides of notebook CSS for static HTML export */ body { #overflow: visible; #padding: 8px; } div#notebook { overflow: visible; border-top: none; }@media print { div.cell { display: block; page-break-inside: avoid; } div.output_wrapper { display: block; page-break-inside: avoid; } div.output { display: block; page-break-inside: avoid; } } </style--> <!-- Custom stylesheet, it must be in the same directory as the html file --> <!--link href="/static/codemirror/codemirror.css" rel="stylesheet"--> <!--link rel="stylesheet" href="/static/css/custom.css"--> <!-- Loading mathjax macro --> <section> <div tabindex="-1" id="notebook" class="border-box-sizing"> <div id="notebook-container"> <div class="cell border-box-sizing text_cell rendered"><div class="prompt input_prompt"> </div> <div class="inner_cell"> <div class="text_cell_render border-box-sizing rendered_html"> <p>现如今我们已经进入了以互联网为主要标志的海量信息时代,这些海量信息中大部分是以自然语言的形式表示的。这些海量信息为算机学习人类语言提供了丰富的资料,同时这也为自然语言处理提供了更加宽广的应用舞台。自然语言处理涉及的应用相当广泛,这里我们介绍几种主要应用。</p> <h2 id="&#26426;&#22120;&#32763;&#35793;">&#26426;&#22120;&#32763;&#35793;<a class="anchor-link" href="#&#26426;&#22120;&#32763;&#35793;">&#182;</a></h2><p>机器翻译(MT)是用计算机自动地将一种自然语言文本(源语言)翻译成另一种自然语言文本(目标语言)。</p> <p>使用机器做翻译的思想最早由 Warren Weaver 于1949年提出。在很长一段时间里(20 世纪 50 年代到 80 年代),机器翻译都是通过研究源语言与目标语言的语言学信息来做的,也就是基于词典和语法生成翻译,这被称为基于规则的机器翻译。随着统计学的发展,研究者开始将统计模型应用于机器翻译,这种方法是基于对双语文本语料库的分析来生成翻译结果。这种方法被称为统计机器翻译(SMT),它的表现比基于规则的机器翻译更好,并且在 1980 年代到 2000 年代之间主宰了这一领域。1997 年,Ramon Neco 和 Mikel Forcada 提出了使用「编码器-解码器」(encoder-decoder)结构做机器翻译的想法。几年之后的2003年,蒙特利尔大学 Yoshua Bengio 领导的一个研究团队开发了一个基于神经网络的语言模型,改善了传统SMT模型的数据稀疏性问题。他们的研究工作为未来神经网络在机器翻译上的应用奠定了基础。之后神经网络机器翻译开始迅速发展,在2013 年Nal Kalchbrenner 和 Phil Blunsom 提出了一种用于机器翻译的新型端到端(end to end)编码器-解码器结构。自2014 年 Yoshua Bengio 的团队为机器翻译引入了“注意力(attention)”机制以后,神经网络机器翻译的表现得到了显著提升,「注意力编码器-解码器网络」也成为了神经网络机器翻译领域当前最佳的模型。</p> </div> </div> </div> <div class="cell border-box-sizing text_cell rendered"><div class="prompt input_prompt"> </div> <div class="inner_cell"> <div class="text_cell_render border-box-sizing rendered_html"> <p><img src="https://github.com/shuwozhiyan/img-repo/raw/master/nmt-model-fast.gif" alt="nmt-model-fast.gif"></p> </div> </div> </div> <div class="cell border-box-sizing text_cell rendered"><div class="prompt input_prompt"> </div> <div class="inner_cell"> <div class="text_cell_render border-box-sizing rendered_html"> <p><center>图为谷歌的神经网络机器翻译(GNMT)的“注意力编码器-解码器网络”架构的机制</p> </div> </div> </div> <div class="cell border-box-sizing text_cell rendered"><div class="prompt input_prompt"> </div> <div class="inner_cell"> <div class="text_cell_render border-box-sizing rendered_html"> <p>就亚洲而言,中国在人工智能领域的的发展速度可以说是日新月异,百度、网易有道、腾讯、搜狗、讯飞、阿里巴巴等许多公司都已经研发部署了神经网络机器翻译。它们全都拼尽全力想在机器翻译的下一轮演进中取得竞争优势。目前来看,我们有足够的理由相信机器翻译还会有更大的突破,并在不久的将来让全社会受益。</p> <h2 id="&#25512;&#33616;&#31995;&#32479;">&#25512;&#33616;&#31995;&#32479;<a class="anchor-link" href="#&#25512;&#33616;&#31995;&#32479;">&#182;</a></h2><p>推荐系统是利用电子商务网站向客户提供商品的信息和建议,来帮助用户选择决定购买哪些商品,其根本是在模拟销售人员帮助客户完成购买的过程。个性化推荐是根据用户的兴趣特点和购买行为等信息,向用户推荐用户感兴趣的商品和信息。</p> </div> </div> </div> <div class="cell border-box-sizing text_cell rendered"><div class="prompt input_prompt"> </div> <div class="inner_cell"> <div class="text_cell_render border-box-sizing rendered_html"> <p><img src="/media/note_images/recommend-sys_1524821136400_1f8b.jpg" alt="recommend-sys.png"></p> <p><center>推荐系统基本框架</p> </div> </div> </div> <div class="cell border-box-sizing text_cell rendered"><div class="prompt input_prompt"> </div> <div class="inner_cell"> <div class="text_cell_render border-box-sizing rendered_html"> <p>推荐系统中需要处理海量的用户生成数据和用户行为数据等,这些都涉及了对于词,语句,文章的各方面的处理。从文本中提取关键词,之后可能会使用到结构化、降维、聚类、计算概率、时序等等处理手段,推荐系统中候选集召回、相关性计算、排序模型特征等具体应用都和自然语言处理密切相关。</p> <h2 id="&#35821;&#38899;&#21161;&#25163;">&#35821;&#38899;&#21161;&#25163;<a class="anchor-link" href="#&#35821;&#38899;&#21161;&#25163;">&#182;</a></h2><p>通过智能对话与即时问答的智能交互,实现帮忙用户解决问题,其主要是帮忙用户解决生活和工作中的不同种类的问题。我们身边经常见到的如苹果的siri,微软的小冰、小娜,百度的度秘,亚马逊的alexa等,这些不论是使用中文还是英文都可以解决我们的实际问题,甚至可以和人们正常聊天,这也日益丰富着我们的生活。</p> </div> </div> </div> <div class="cell border-box-sizing text_cell rendered"><div class="prompt input_prompt"> </div> <div class="inner_cell"> <div class="text_cell_render border-box-sizing rendered_html"> <p><figure class="half"> <img src="/media/note_images/合并_1524821132890_1f8b.jpg" /> </figure></p> <center>图为苹果siri使用实例</center> </div> </div> </div> <div class="cell border-box-sizing text_cell rendered"><div class="prompt input_prompt"> </div> <div class="inner_cell"> <div class="text_cell_render border-box-sizing rendered_html"> <p>涉及自然语言的应用还有很多很多,包括生活中的方方面面,如我们最常用的搜索引擎也使用了很多相关的技术。作为自然语言处理的重要应用,机器翻译也已经从实验室走入寻常百姓家,谷歌、百度等公司都提供了基于海量网络数据的机器翻译和辅助翻译工具;涉及了自然语言处理的个性化推荐系统也已经应用于各种电商活动中,如在淘宝,京东等中都有使用;带有语音识别的计算机和智能手机也已经进入人们的日程生活,协助我们更有效更方便地工作学习。</p> <p>总之,随着互联网的普及和其产生的海量数据,自然语言处理正在人们的日常生活中扮演着越来越重要的作用。</p> </div> </div> </div> </div> </div> </section>
实战演练(0)
返回 >

暂无相关实战演练哦~