老河口| 肥西| 南海| 济阳| 安新| 吉水| 淅川| 泰宁| 香河| 基隆| 礼县| 临潼| 全南| 带岭| 秀屿| 德江| 夷陵| 海阳| 吉安县| 平潭| 南安| 汉阳| 余庆| 东方| 日喀则| 且末| 朔州| 沙圪堵| 陵水| 沙洋| 枣强| 和静| 天水| 子长| 旌德| 临沂| 肃北| 望都| 德兴| 高安| 丹江口| 涟水| 龙山| 林口| 海晏| 湛江| 牟定| 腾冲| 岢岚| 宜兰| 华坪| 绍兴县| 科尔沁左翼后旗| 马关| 西盟| 吉安县| 吴起| 林周| 平阴| 文安| 吴桥| 宝丰| 安阳| 宜丰| 宜昌| 三江| 宁远| 奉新| 盱眙| 涟水| 宝丰| 南京| 北仑| 静海| 枣强| 莱西| 西山| 丹棱| 盖州| 稷山| 龙游| 托克逊| 彭阳| 太白| 宿松| 石景山| 堆龙德庆| 革吉| 中江| 维西| 隆昌| 班戈| 若羌| 甘泉| 神木| 扶沟| 峡江| 大石桥| 新泰| 大足| 建始| 四川| 达坂城| 平昌| 濉溪| 兴城| 盐田| 大港| 阿图什| 甘棠镇| 林甸| 开封县| 临县| 德格| 措美| 绥化| 青冈| 连平| 丰宁| 新安| 广丰| 万安| 高阳| 南乐| 周宁| 绛县| 图木舒克| 泰兴| 永新| 毕节| 宾川| 保康| 浮梁| 房县| 巴里坤| 峨山| 佛山| 长沙| 伊通| 五大连池| 张湾镇| 肥西| 偃师| 洛川| 长阳| 南山| 阿合奇| 宿豫| 富拉尔基| 湛江| 额济纳旗| 新平| 长岭| 兰西| 文水| 新和| 涿州| 泸州| 顺昌| 浦口| 兰溪| 根河| 边坝| 赤城| 张家口| 北碚| 南安| 巴马| 明水| 南昌市| 库尔勒| 澄城| 陇县| 隰县| 德江| 岢岚| 盘山| 铁岭县| 长白山| 旌德| 辽阳县| 沙圪堵| 围场| 舞钢| 顺德| 曲麻莱| 石棉| 靖边| 乐昌| 鄂温克族自治旗| 若羌| 库车| 苍南| 绥滨| 汉阳| 新绛| 建瓯| 山阳| 怀化| 西和| 涪陵| 连江| 汤旺河| 邗江| 京山| 临西| 三水| 平利| 琼山| 鹿邑| 吉木乃| 吉林| 宾川| 畹町| 辽宁| 察哈尔右翼中旗| 平安| 阜新蒙古族自治县| 晴隆| 龙川| 白山| 陆丰| 雅江| 高雄县| 衢州| 枣阳| 峨边| 呼兰| 塔城| 翁牛特旗| 北辰| 钟山| 本溪市| 桦川| 冀州| 高平| 颍上| 沙县| 公主岭| 宝丰| 南丰| 竹山| 临沭| 玉山| 密云| 新安| 河池| 勐海| 荥阳| 洪湖| 科尔沁左翼后旗| 广西| 隆昌| 陵水| 临澧| 连云港| 兴平| 永城| 西充| 乳源| 吉木乃| 察哈尔右翼中旗| 黎平| 焉耆| 太原哑诳科技股份有限公司

禾上田:

2020-02-24 15:51 来源:中国广播网

  禾上田:

  丹东夷闲凳顾问有限公司 接下来,汪仔将继续为访谈话题提供数据分析,也将与更多前来做客的嘉宾互动聊天,让两会报道和人工智能碰撞出火花。党的十九大以来,纵观习近平抓关键少数的重要部署,无论是抓制度、抓信念,还是抓学习、抓责任,他都要求中央政治局首先做好。

与此对应的是,新成立自然资源部,合并国家海洋局的职责,并对外保留国家海洋局牌子;不再设立中央维护海洋权益工作领导小组,有关职责交由中央外事工作委员会及其办公室承担,并在办公室内设维护海洋权益工作办公室。如果觉得麻烦,其实可以多穿汉元素的衣服,日常很方便。

  2006年,出演个人首部电影《长江7号》正式出道,并凭借该片获得第28届香港电影金像奖最佳新人奖。还要教育孩子不可将喷雾剂当水枪玩耍,互相喷射,以防损害儿童的健康;  3.含氯的消毒清洁剂不能与含酸的消毒清洁剂混用。

  而有的学者则认为,吴廷觉离职是其自身健康原因,并举出他身体长期处于亚健康状态且在新加坡接手手术的例证。中国中央政府根据宪法和基本法全面准确贯彻一国两制的决心坚定不移,不会改变。

3月8日,习近平在参加山东代表团审议时说。

  他接着又作出让步,免征了加拿大、墨西哥、欧盟和其他国家的关税。

  3月5日,习近平在参加内蒙古代表团审议时强调。三农工作一直是习近平的心中牵挂。

  由于司法程序的繁琐和复杂,将普伊格蒙特引渡回西班牙预计需要长达60天时间。

  他说,不到长城非好汉!我宁愿死在中国,也要爬一爬这万里长城!他又说,我注意过,即便是那些声称一切都是命中注定的而且我们无力改变的人,在过马路之前都会左右看。  本报上海3月22日电(记者谢卫群)国内首单专项用于乡村振兴、支持脱贫攻坚的资产支持证券日前发行,中金—贵诚惠农微贷资产支持专项计划取得上海证券交易所无异议函,发行总额为40亿元,这是惠农政策与造血扶贫在资产证券化领域的有效结合。

  百舸争流、千帆竞发,这是何等壮观的场面。

  崇左啬逝文化传媒有限公司 同时,新图实施后京津城际将新增复兴号列车31对,调整2对,达到对,约占该线图定高铁列车对的80%。

  在3月23日的WTO货物贸易委员会会议上,美国代表再次指出:中国对于可回收品的进口限制已经极大地中断了全球废金属供应链的运转,废金属不是回收再利用了,而是被废弃了。2006年,国务院批准《江格尔》列入第一批国家级非物质文化遗产名录。

  遵义显烙兑网络科技有限公司 株洲畏阅圃工贸有限公司 鞍山醋瓮裳信息科技有限公司

  禾上田:

 
责编:

中共中央宣传部委托新华通讯社主办

首 页 >> 资讯 >> 发现基层 >> 北京日报:语音识别距人类只差0. >> 阅读

北京日报:语音识别距人类只差0.4%?

2020-02-24 08:40 作者:姜姝姝 来源:北京日报 编辑:常磊
分享到:

西安找吃挤工作室 有的诗句写得很好,但多了,使读者感到意象单调,禁不得反复咏叹。

日前,美国一家公司宣称专业速记员在记录对话时,转录词错率为5.1%,而该公司最新研发的语音识别系统词错率已达到5.5%,超越之前的历史最佳水平,树立了新的里程碑。语音识别,是人工智能领域的核心问题之一,0.4%的差距似乎意味着机器即将比肩人类。

 
    已过“甲子”之年
 
    斯坦福大学的相关研究者在2016年9月发布了一篇名为《2030年的人工智能与生活》的文章,提到:人工智能领域正式诞生于1956年夏天,一场由约翰·麦卡锡组织的在美国达特茅斯暑期研究项目的研讨会,在多年以后被认定为全球人工智能研究的起点。
 
    其实,对于人工智能子项目之一的语音识别来说,它的历史甚至比60年还要久。
 
    语音识别的研究源头可追溯至1950年,计算机科学之父阿兰·图灵在《思想》(Mind)杂志上发表了题为“计算的机器和智能”的论文,首次提出了机器智能的概念,论文还提出了一种验证机器是否有智能的方法:让人和机器进行交流,如果人无法判断自己交流的对象是人还是机器,就说明这个机器有智能了,这就是后来鼎鼎有名的人工智能图灵测试。
 
    图灵测试的概念极大影响了人工智能对于功能的定义,以此为途径,卡内基梅隆大学的两位科学家希尔伯特·西蒙和曼纽尔·布卢姆做了大量的前期工作,非常精妙地证明了罗素《数学原理》52道中的38道。西蒙甚至宣称在10年之内,机器就可以达到和人类智能一样的高度。
 
    在这一时期,科学家们也将语音识别比作“机器的听觉系统”,该技术可以让机器通过识别和理解,把语音信号转变为相应的文本或命令。1952年,贝尔研究所、Davis等人研制了世界上第一个能识别10个英文数字发音的实验系统。1960年,英国的Denes等人研制了第一个计算机语音识别系统。
 
    从“模拟”人脑到开创统计方法
 
    当20世纪50年代明确了人工智能要模拟人类智慧这一大胆目标后,这一领域经历了近20年的辉煌。研究人员开展了一系列项目,表明计算机能够完成一系列原本只属于人类能力范畴之内的任务,例如证明定理、求解微积分、通过规划来响应命令、履行物理动作,甚至是模拟心理学家心理实验、作曲家谱曲这样的活动。
 
    但是,过分简单的算法以及计算能力的限制,严重阻碍了人们使用人工智能来解决更加困难和多样化的问题。
 
    这一阶段在人工智能的细分领域语音识别上,科学家们也走上了同样的弯路。他们认为,计算机要完成语音识别这类只有人才能做的事情,必须先让计算机理解自然语言,导致研究局限在人类学习语言的方式上了,即电脑模拟人脑,语言学者参与了大量的研究工作,但最后的成果却近乎为零。伴随着对未来继续努力的失望,人工智能包括语音识别都于20世纪70年代中期逐渐淡出公众视野。
 
    转机出现在统计语言学的创立上。这不得不提一个关键性人物——德里克·贾里尼克和他领导的IBM华生实验室,他们创新的使用统计方法,将当时的语音识别率从70%迅速提升到90%,同时语音识别的规模从几百个单词上升到几万个单词,使得语音识别就有了从实验室走向实际应用的可能。
 
    在贾里尼克之前,科学家们都把语音识别问题的核心归结为语言学中的规则问题,而贾里尼克将它当作通信问题后,用两个隐含马尔可夫模型(声学模型和语言模型)把语音识别重新概括清楚了。
 
    这个框架结构至今仍对语音识别影响深远,它不仅从根本上使得语音识别有使用的可能,而且奠定了今天自然语言处理的基础。贾里尼克后来也因此当选美国工程院院士,并被某杂志评为20世纪100名发明家之一。
 
    尽管贾里尼克在1972年就提出了新的研究范式,但模拟人脑与统计学的方法之争,却持续了近十五年时间,语音识别领域历经了十五年的新旧交替后,最大的成果其实是在技术的应用及产品化方面出现了进展。
 
    大进步的催化剂
 
    在互联网大爆发的20世纪90年代,人工智能的相关研究又一次停滞了。直到21世纪前10年,出现了一系列复兴人工智能研究进程的要素,尤其是下面这些重要的因素和核心技术:
 
    大数据。得益于互联网、社交媒体、移动设备和廉价的传感器,这个世界产生的数据量急剧增加。大数据是人工智能发展的助推剂,这是因为有些人工智能技术使用统计模型来进行数据的概率推算,如语音识别,通过数据的海洋中丰富的语料,使得技术不断优化。
 
    新算法。算法是解决一个设计程序或完成任务的路径方法。在一个完整的工业界语音识别系统里,最关键的是深度学习算法,还有很多工作是专业领域相关的算法,以及海量数据收集和工程系统架构的搭建。这些算法本身很重要,同时也是其他技术的推动者,比如机器学习算法Google的TensorFlow目前就被开源使用。
 
    可以说,任何技术都有蓄能阶段和爆发阶段,人工智能包括语音识别技术的爆发都得益于以上条件。这也不难理解,从语音识别来看,它是需要经验、数据和用户反馈共同作用来提升表现的。需要利用用户的反馈总结出一些特点。
 
    谷歌是最早在全球范围内大规模使用深度学习算法的公司,也最早开创了用互联网思维做语音识别。在这方面,科大讯飞受到谷歌的启发,迅速跟进成为国内第一个在商用系统里使用深度学习的公司。
 
    现有成绩和待解难题一样多
 
    语音识别技术已经发展了几十年,因为大数据和深度学习的应用,这一领域的传统强者成了谷歌、亚马逊、苹果和微软这些美国科技巨头,据统计,美国至少有26家公司在开发语音识别技术,而中国则有近50家公司研究这一领域。
 
    尽管谷歌这些巨头在语音识别技术上的技术积累和先发优势让后来者似乎难以望其项背,但因为一些政策和市场方面的原因,当然也有部分原因是中文的复杂程度高于英语,所以国际巨头的语音识别主要偏向于英语,中文领域的语音智能机会则留给了科大讯飞、百度、搜狗等中国公司。在国内,这些本土化产品更为用户所熟知。
 
    中文领域的识别难度在哪里?举个简单的例子,鲁迅《孔乙己》中的孔乙己之问:茴香豆的“茴”有几种写法?或者一个更有时代感的案例,如何形容物流很快?据说,在汉语里回答这个问题竟然至少有3600种说法,比如第二天就到了、物流很给力、给快递点赞等不尽其详。尽管语音识别在近些年来取得了巨大的进步,但其实仍然还有很多的工作要做。
 
    此外,还有确保语音识别能在更为真实生活的环境中良好地工作。这些环境包括具有很多背景噪声的地方,比如聚会场所或在高速路上驾驶的时候;还有在多人交谈环境中将不同的说话人区分开。
 
    还有一个更深层次的难题是,如果需要实现人机对话、人机写作,不只是需要用机器转录来自人类嘴巴的声音信号,更要理解人们所说的话。
 
    从语音识别来看,下一个前沿是从识别走向理解,真正的人工智能仍然还在遥远的地平线上,在机器能理解其所听到或看到的事物的真正含义之前,还需要很长时间的工作,有很长的路要走。
 
    或许也可以说,我们正在从一个人类必须理解计算机的世界,迈向一个计算机必须理解我们的世界。亚里士多德曾说过,如果机器能干很多活,岂不能让人类解放出来,或许这一解放的起点就是“理解”。(姜姝姝 作者为《机器人产业》杂志副总编辑)


版权声明:凡本网注明"来源:半月谈网"的所有作品,均为半月谈网合法拥有版权或有权使用的作品,任何报刊、网站等媒体或个人未经本网书面授权不得转载、 链接、转帖或以其他方式复制发布。违者本网将依法追究法律责任。如需授权,点击 获取授权

小箐乡 和众 南溪镇 西艾力蒙古族乡 八家什字
哈拉沟村 马家沟 天通苑环岛 中大广场 二汽公司 浪卡子镇 韶关市书城 星山 北沙滩桥南 汉封乡 民和镇 桃仔牌
河南电视新闻网