㈠ 语音识别系统的历史
早在计算机发明之前,自动语音识别的设想就已经被提上了议事日程,早期的声码器可被视作语音识别及合成的雏形。而1920年代生产的Radio Rex玩具狗可能是最早的语音识别器,当这只狗的名字被呼唤的时候,它就能够从底座上弹出来。最早的基于电子计算机的语音识别系统是由AT&T贝尔实验室开发的Audrey语音识别系统,它能够识别10个英文数字。其识别方法是跟踪语音中的共振峰。该系统得到了98%的正确率。。到1950年代末,伦敦学院(Colledge of London)的Denes已经将语法概率加入语音识别中。
1960年代,人工神经网络被引入了语音识别。这一时代的两大突破是线性预测编码Linear Predictive Coding (LPC), 及动态时间弯折Dynamic Time Warp技术。
语音识别技术的最重大突破是隐含马尔科夫模型Hidden Markov Model的应用。从Baum提出相关数学推理,经过Labiner等人的研究,卡内基梅隆大学的李开复最终实现了第一个基于隐马尔科夫模型的大词汇量语音识别系统Sphinx。。此后严格来说语音识别技术并没有脱离HMM框架。
尽管多年来研究人员一直尝试将“听写机”推广,语音识别技术在目前还无法支持不限领域,不限说话人的听写机应用。
㈡ 中国信息发展史
信息技术 信息技术:Information Technology(英文) 简称IT 凡是能扩展人的信息功能的技术,都是信息技术。可以说,这就是信息技术的基本定义。它主要是指利用电子计算机和现代通信手段实现获取信息、传递信息、存储信息、处理信息、显示信息、分配信息等的相关技术。 具体来讲,信息技术主要包括以下几方面技术: 1.感测与识别技术 它的作用是扩展人获取信息的感觉器官功能。它包括信息识别、信息提取、信息检测等技术。这类技术的总称是“传感技术”。它几乎可以扩展人类所有感觉器官的传感功能。传感技术、测量技术与通信技术相结合而产生的遥感技术,更使人感知信息的能力得到进一步的加强。 信息识别包括文字识别、语音识别和图形识别等。通常是采用一种叫做“模式识别”的方法。 2.信息传递技术 它的主要功能是实现信息快速、可靠、安全的转移。各种通信技术都属于这个范畴。广播技术也是一种传递信息的技术。由于存储、记录可以看成是从“现在”向“未来”或从“过去”向“现在”传递信息的一种活动,因而也可将它看作是信息传递技术的一种。 3.信息处理与再生技术 信息处理包括对信息的编码、压缩、加密等。在对信息进行处理的基础上,还可形成一些新的更深层次的决策信息,这称为信息的“再生”。信息的处理与再生都有赖于现代电子计算机的超凡功能。 4.信息施用技术 是信息过程的最后环节。它包括控制技术、显示技术等。 由上可见,传感技术、通信技术、计算机技术和控制技术是信息技术的四大基本技术,其中现代计算机技术和通信技术是信息技术的两大支柱。 摘自《江苏科技咨询网》 信息技术是指有关信息的收集、识别、提取、变换、存贮、传递、处理、检索、检测、分析和利用等的技术。凡涉及到这些过程和技术的工作部门都可称作信息部门。 信息技术能够延长或扩展人的信息功能。信息技术可能是机械的,也可能是激光的;可能是电子的,也可能是生物的。 信息技术主要包括传感技术,通信技术,计算机技术和缩微技术等。 传感技术的任务是延长人的感觉器官收集信息的功能;通信技术的任务是延长人的神经系统传递信息的功能;计算机技术则是延长人的思维器官处理信息和决策的功能;缩微技术是延长人的记忆器官存贮信息的功能。当然,这种划分只是相对的、大致的,没有截然的界限。如传感系统里也有信息的处理和收集,而计算机系统里既有信息传递,也有信息收集的问题。 目前,传感技术已经发展了一大批敏感元件,除了普通的照相机能够收集可见光波的信息、微音器能够收集声波信息之外,现在已经有了红外、紫外等光波波段的敏感元件,帮助人们提取那些人眼所见不到重要信息。还有超声和次声传感器,可以帮助人们获得那些人耳听不到的信息。不仅如此,人们还制造了各种嗅敏、味敏、光敏、热敏、磁敏、湿敏以及一些综合敏感元件。这样,还可以把那些人类感觉器官收集不到的各种有用信息提取出来,从而延长和扩展人类收集信息的功能。 通信技术的发展速度之快是惊人的。从传统的电话,电报,收音机,电视到如今的移动电话,传真,卫星通信,这些新的、人人可用的现代通信方式使数据和信息的传递效率得到很大的提高,从而使过去必须由专业的电信部门来完成的工作,可由行政、业务部门办公室的工作人员直接方便地来完成。通信技术成为办公自动化的支撑技术。 计算机技术与现代通信技术一起构成了信息技术的核心内容。计算机技术同样取得了飞速的发展,体积越来越小,功能越来越强。从大型机,中型机,小型机到微型机,笔记本式计算机,便携式计算机等。从PC 机,286,386到486,586等,计算机的应用也取得了很大的发展。例如,电子出版社系统的应用改变了的传统印刷、出版业;计算机文字处理系统的应用使作家改变了原来的写作方式,称作“换笔”革命;光盘的实用使人类的信息存储能力得到了很大程度的延伸,出现了电子图书这样的新一代电子出版物;多媒体技术的发展使音乐创作、动画制作等成为普通人可以涉足的领域。 国外的缩微技术发展很快,美国是缩微技术最发达的国家。例如闻名世界的美国UMI 公司是一个收集、贮藏,以及提供文献检索的出版公司,其服务范围包括近一百五十万册历代书籍、期刊、博士论文、档案以及原件。它的产品不但包括印刷品、缩微平片,而且提供机读信息。第二次世界大战期间,该公司利用所谓缩微技术,抢救了大英博物馆的许多珍贵文献。迄今为止,该公司存有自15世纪至今的10万种世界各地的绝版书
㈢ 语音识别的发展史
1952年贝尔研究所Davis等人研究成功了世界上第一个能识别10个英文数字发音的实验系统。
1960年英国的Denes等人研究成功了第一个计算机语音识别系统。
大规模的语音识别 研究是在进入了70年代以后,在小词汇量、孤立词的识别方面取得了实质性的进展。
进入80年代以后,研究的重点逐渐转向大词汇量、非特定人连续语音识别。在研究思路上也发生了重大变化,即由传统的基于标准模板匹配的技术思路开始转向基于统计模型 (HMM)的技术思路。此外,再次提出了将神经网络技术引入语音识别问题的技术思路。
进入90年代以后,在语音识别的系统框架方面并没有什么重大突破。但是,在语音识别技术的应用及产品化方面出现了很大的进展。
DARPA(Defense Advanced Research Projects Agency)是在70年代由美国国防部远景研究计划局资助的一项10年计划,其旨在支持语言理解系统的研究开发工作。
到了80年代,美国国防部远景研究计划局又资助了一项为期10年的DARPA战略计划,其中包括噪声下的语音识别和会话(口语)识别系统,识别任务设定为“(1000单词)连续语音数据库管理”。
到了90年代,这一DARPA计划仍在持续进行中。其研究重点已转向识别装置中的自然语言处理部分,识别任务设定为“航空旅行信息检索”。
日本也在1981年的第五代计算机计划中提出了有关语音识别输入-输出自然语言的宏伟目标,虽然没能实现预期目标,但是有关语音识别技术的研究有了大幅度的加强和进展。
1987年起,日本又拟出新的国家项目---高级人机口语接口和自动电话翻译系统。 中国的语音识别研究起始于1958年,由中国科学院声学所利用电子管电路识别10个元音。直至1973年才由中国科学院声学所开始计算机语音识别。由于当时条件的限制,中国的语音识别研究工作一直处于缓慢发展的阶段。
进入80年代以后,随着计算机应用技术在中国逐渐普及和应用以及数字信号技术的进一步发展,国内许多单位具备了研究语音技术的基本条件。与此同时,国际上语音识别技术在经过了多年的沉寂之后重又成为研究的热点,发展迅速。就在这种形式下,国内许多单位纷纷投入到这项研究工作中去。
1986年3月中国高科技发展计划(863计划)启动,语音识别作为智能计算机系统研究的一个重要组成部分而被专门列为研究课题。在863计划的支持下,中国开始了有组织的语音识别技术的研究,并决定了每隔两年召开一次语音识别的专题会议。从此中国的语音识别技术进入了一个前所未有的发展阶段。 这一时期的语音识别方法基本上是采用传统的模式识别策略。其中以苏联的Velichko和Zagoruyko、日本的迫江和千叶,以及当时在美国的板仓等人的研究工作最具有代表性。
· 苏联的研究为模式识别应用于语音识别这一领域奠定了基础;
· 日本的研究则展示了如何利用动态规划技术在待识语音模式与标准语音模式之间进行非线性时间匹配的方法;
·板仓的研究提出了如何将线性预测分析技术(LPC)加以扩展,使之用于语音信号的特征抽取的方法。 目前在大词汇语音识别方面处于领先地位的IBM语音研究小组,就是在70年代开始了它的大词汇语音识别研究工作的。AT&T的贝尔研究所也开始了一系列有关非特定人语音识别的实验。这一研究历经10年,其成果是确立了如何制作用于非特定人语音识别的标准模板的方法。
这一时期所取得的重大进展有:
⑴隐式马尔科夫模型(HMM)技术的成熟和不断完善成为语音识别的主流方法。
⑵以知识为基础的语音识别的研究日益受到重视。在进行连续语音识别的时候,除了识别声学信息外,更多地利用各种语言知识,诸如构词、句法、语义、对话背景方面等的知识来帮助进一步对语音作出识别和理解。同时在语音识别研究领域,还产生了基于统计概率的语言模型。
⑶人工神经网络在语音识别中的应用研究的兴起。在这些研究中,大部分采用基于反向传播算法(BP算法)的多层感知网络。人工神经网络具有区分复杂的分类边界的能力,显然它十分有助于模式划分。特别是在电话语音识别方面,由于其有着广泛的应用前景,成了当前语音识别应用的一个热点。
另外,面向个人用途的连续语音听写机技术也日趋完善。这方面,最具代表性的是IBM的ViaVoice和Dragon公司的Dragon Dictate系统。这些系统具有说话人自适应能力,新用户不需要对全部词汇进行训练,便可在使用中不断提高识别率。
中国的语音识别技术的发展 :⑴在北京有中科院声学所、自动化所、清华大学、北方交通大学等科研机构和高等院校。另外,还有哈尔滨工业大学、中国科技大学、四川大学等也纷纷行动起来。
⑵现在,国内有不少语音识别系统已研制成功。这些系统的性能各具特色。
· 在孤立字大词汇量语音识别方面,最具代表性的要数92年清华大学电子工程系与中国电子器件公司合作研制成功的THED-919特定人语音识别与理解实时系统。
· 在连续语音识别方面,91年12月四川大学计算机中心在微机上实现了一个主题受限的特定人连续英语——汉语语音翻译演示系统。
·在非特定人语音识别方面,有清华大学计算机科学与技术系在87年研制的声控电话查号系统并投入实际使用。
㈣ 信息技术的发展史
中国的电子信息产业出现于20世纪二十年代。1929年10月,中国民党政府军政部在南京建立“电信机械修造总厂”,主要生产军用无线电收发报机,以后又组建了“中央无线电器材有限公司”,“南京雷达研究所”等研究生产单位。中华人民共和国建立后,政府十分重视电子工业的发展。最初,在中央人民政府人民革命军事委员会成立电讯总局,接管了官僚资本遗留下来的11个无线电企业,并与原革命根据地的无线电器材修配厂合并,恢复了生产。1950年10月,中国政务院决定在重工业部设立电信工业局。1963年,中国国家决定成立第四机械工业部,专属中国国防工业序列。这标志着中国电子信息产业成了独立的工业部门。
1983年,第四机械工业部改称电子工业部。中国的电子工业经过几十年的建设和发展,已经具有相当规模,形成了军民结合、专业门类比较齐全的新兴工业部门。到90年代初,中国电子工业已经能够主要依靠国产电子元器件生产20多类、数千种整机设备以及各种元器件,许多精密复杂的产品达到了较高水平,并形成了雷达、通信导航、广播电视、电子计算机、电子元器件、电子测量仪器与电子专用设备等六大产业。中国电子信息产业已具有门类齐全的军用电子元器件科研开发与配套能力,具有一定水平的系统工程科技攻关能力;基本能满足战略武器、航天技术、飞机与舰船、火炮控制和各种电子化指挥系统的需要;到2008年,电子信息产业所提供的产品都达到了较高技术水平,其中不少达到世界先进水平。
㈤ 语音识别系统包括哪五个部分
随着AI快速发展的今天,语音识别也成为众多设备的标配,语音识别开始被越内来越多人的关注,国容外微软、苹果、谷歌,国内的科大讯飞、思必弛、云知声等厂商都在研发语音识别新策略新算法,似乎人类与语音的自然交互渐行渐近。
语音识别是以语音的研究为对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。
语音识别系统本质上是一种模式识别系统,包括特征提取、模式匹配、参考模式库等三个基本单元。
一套完整的语音识别系统,工作过程分为7步:
1.对语音信号进行分析和处理,除去冗余信息。
2.提取影响语音识别的关键信息和表达语言含义的特征信息。
3.紧扣特征信息,用最小单元识别字词。
4.按照不同语言的各自语法,依照先后次序识别字词。
5.把前后意思当作辅助识别条件,有利于分析和识别。
6.按照语义分析,给关键信息划分段落,取出所识别出的字词并连接起来,同时根据语句意思调整句子构成。
7.结合语义,仔细分析上下文的相互联系,对当前正在处理的语句进行适当修正
㈥ 人工智能的发展概况
探讨人工智能,就要回答什么是智能的问题,综合各类定义,智能是一种知识与思维的合成,是人类认识世界和改造世界过程中的一种分析问题和解决问题的综合能力。对于人工智能,美国麻省理工学院的温斯顿教授提出“人工智能就是研究如何使计算机去做过去只有人才能做的智能工作”,斯坦福大学人工智能研究中心尼尔逊教授提出“人工智能是关于知识的学科――怎样表示知识以及怎样获得知识并使用知识的科学”。综合来看人工智能是相对人的智能而言的。其本质是对人思维的信息过程的模拟,是人的智能的物化。是研究、开发模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
(一)感知、处理和反馈构成人工智能的三个关键环节
人工智能经过信息采集、处理和反馈三个核心环节,综合表现出智能感知、精确性计算、智能反馈控制,即感知、思考、行动三个层层递进的特征。
智能感知:智能的产生首先需要收集到足够多的结构化数据去表述场景,因此智能感知是实现人工智能的第一步。智能感知技术的目的是使计算机能 “听”、会“看”,目前相应的计算机视觉技术和自然语言处理技术均已经初步成熟,开始商业化尝试。
智能处理:产生智能的第二步是使计算机具备足够的计算能力模拟人的某些思维过程和行为对分析收集来的数据信息做出判断,即对感知的信息进行自我学习、信息检索、逻辑判断、决策,并产生相应反映。具体的研究领域包括知识表达、自动推理、机器学习等,与精确性计算及编程技术、存储技术、网络技术等密切相关,是大数据技术发展的远期目标,目前该领域研究还处于实验室研究阶段,其中机器学习是人工智能领域目前热度最高,科研成果最密集的领域。
智能反馈:智能反馈控制将前期处理和判断的结果转译为肢体运动和媒介信息传输给人机交互界面或外部设备,实现人机、机物的信息交流和物理互动。智能反馈控制是人工智能最直观的表现形式,其表达能力展现了系统整体的智能水平。智能反馈控制领域与机械技术、控制技术和感知技术密切相关,整体表现为机器人学,目前机械技术受制于材料学发展缓慢,控制技术受益于工业机器人领域的积累相对成熟。
(二)深度学习是当前最热的人工智能研究领域
在学术界,实现人工智能有三种路线,一是基于逻辑方法进行功能模拟的符号主义路线,代表领域有专家系统和知识工程。二是基于统计方法的仿生模拟的连接主义路线,代表领域有机器学习和人脑仿生,三是行为主义,希望从进化的角度出发,基于智能控制系统的理论、方法和技术,研究拟人的智能控制行为。
当前,基于人工神经网络的深度学习技术是当前最热的研究领域,被Google,Facebook,IBM,网络,NEC以及其他互联网公司广泛使用,来进行图像和语音识别。人工神经网络从上个世纪80年代起步,科学家不断优化和推进算法的研究,同时受益于计算机技术的快速提升,目前科学家可以利用GPU(图形处理器)模拟超大型的人工神经网络;互联网业务的快速发展,为深度学习提供了上百万的样本进行训练,上述三个因素共同作用下使语音识别技术和图像识别技术能够达到90%以上的准确率。
(三)主要发达国家积极布局人工智能技术,抢占战略制高点。
各国政府高度重视人工智能相关产业的发展。自人工智能诞生至今,各国都纷纷加大对人工智能的科研投入,其中美国政府主要通过公共投资的方式牵引人工智能产业的发展,2013财年美国政府将22亿美元的国家预算投入到了先进制造业,投入方向之一便是“国家机器人计划”。
在技术方向上,美国将机器人技术列为警惕技术,主攻军用机器人技术,欧洲主攻服务和医疗机器人技术,日本主攻仿人和娱乐机器人。
现阶段的技术突破的重点一是云机器人技术,二是人脑仿生计算技术。美国、日本、巴西等国家均将云机器人作为机器人技术的未来研究方向之一。伴随着宽带网络设施的普及,云计算、大数据等技术的不断发展,未来机器人技术成本的进一步降低和机器人量产化目标实现,机器人通过网络获得数据或者进行处理将成为可能。目前国外相关研究的方向包括:建立开放系统机器人架构(包括通用的硬件与软件平台)、网络互联机器人系统平台、机器人网络平台的算法和图像处理系统开发、云机器人相关网络基础设施的研究等。
由于深度学习的成功,学术界进一步沿着连接主义的路线提升计算机对人脑的模拟程度。人脑仿生计算技术的发展,将使电脑可以模仿人类大脑的运算并能够实现学习和记忆,同时可以触类旁通并实现对知识的创造,这种具有创新能力的设计将会让电脑拥有自我学习和创造的能力,与人类大脑的功能几无二致。在2013年初的国情咨文中,美国总统奥巴马特别提到为人脑绘图的计划,宣布投入30亿美元在10年内绘制出“人类大脑图谱”,以了解人脑的运行机理。欧盟委员会也在2013年初宣布,石墨烯和人脑工程两大科技入选“未来新兴旗舰技术项目”,并为此设立专项研发计划,每项计划将在未来10年内分别获得10亿欧元的经费。美国IBM公司正在研究一种新型的仿生芯片,利用这些芯片,人类可以实现电脑模仿人脑的运算过程,预计最快到2019年可完全模拟出人类大脑。
(四)高科技企业普遍将人工智能视为下一代产业革命和互联网革命的技术引爆点进行投资,加快产业化进程。
谷歌在2013年完成了8 家机器人相关企业的收购,在机器学习方面也大肆搜罗企业和人才,收购了DeepMind和计算机视觉领军企业Andrew Zisserman,又聘请DARPA原负责人 Regina Dugan负责颠覆性创新项目的研究,并安排构建Google基础算法和开发平台的著名计算机科学家Jeff Dean转战深度学习领域。苹果2014 年在自动化上的资本支出预算高达110 亿美元。苹果手机中采用的Siri智能助理脱胎于美国先进研究项目局(DARPA)投资1.5亿美元,历时5年的CALO( Cognitive Assistant that Learns and Organizes)项目,是美国首个得到大规模产业化应用的人工智能项目。Amazon计划在2015 年能够使用自己的机器人飞行器进行快递服务。韩国和日本的各家公司也纷纷把机器人技术移植到制造业新领域并尝试进入服务业
(五)人工智能的实际应用
人工智能概念从1956年提出,到今天初步具备产品化的可能性经历了58年的演进,各个重要组成部分的研究进度和产品化水平各不相同。人工智能产品的发展是一个渐进性的过程,是一个从单一功能设备向通用设备,从单一场景到复杂场景,从简单行为到复杂行为的发展过程,具有多种表现形式。
人工智能产品近期仍将作为辅助人类工作的工具出现,多表现为传统设备的升级版本,如智能/无人驾驶汽车,扫地机器人,医疗机器人等。汽车、吸尘器等产品和人类已经有成熟的物理交互模式,人工智能技术通过赋予上述产品一定的机器智能来提升其自动工作的能力。但未来将会出现在各类环境中模拟人类思维模式去执行各类任务的真正意义的智能机器人,这类产品没有成熟的人机接口可以借鉴,需要从机械、控制、交互各个层面进行全新研发。
希望我的回答可以帮到您哦
㈦ 人机交互技术的发展历史
市场需求是很大的,而供应方面却略显不足,尤其是拥有核心知识产权,技术过硬的企业并不多,行业整体缺乏品牌效应。
⒈WIMP界面的形成
Xerox Palo研究中心于70年代中后期研制出原型机Star,形成了以窗口(Windows)、菜单(Menu)、图符(Icons)和指示装置(Pointing Devices)为基础的图形用户界面,也称WIMP界面。
Apple最先采用了这种图形界面,斯坦福研究所60年代的发展计划也对WIMP界面的发展产生了重要的影响。该计划强调增强人的智能,把人而不是技术放在了人机交互的中心位置。该计划的结果导致了许多硬件的发明,众所周知的鼠标就是其中之一。
⒉WIMP界面面临的问题和发展多媒体计算机和VR系统的出现,改变了人与计算机通信的方式和要求,使人机交互发生了很大的变化。在多媒体系统中继续采用WIMP界面有其内在的缺陷:随着多媒体软硬件技术的发展,在人机交互界面中计算机可以使用多种媒体,而用户只能同时用一个交互通道进行交互因而从计算机到用户的通信带宽要比从用户到计算机的大得多,这是一种不平衡的人-计算机交互。
虚拟现实技术除了要求有高度自然的三维人机交互技术外,由于受交互装置和交互环境的影响,不可能也不必要对用户的输入做精确的测量,而是一种非精确的人机交互。三维人机交互技术在科学计算可视化和三维CAD系统中占有重要的地位。基于WIMP技术的图形用户界面,从本质上讲,是一种二维交互技术,不具有三维直接操作的能力。要从根本上改变这种不平衡的通信,人机交互技术的发展必须适应从精确交互向非精确交互、从单通道交互向多通道交互以及从二维交互向三维交互的转变,发展用户与计算机之间快速、低耗的多通道界面。从右上表可以看出在计算机系统不同的发展阶段中,人机交互模型的发展过程。在传统的人机系统中,人被认为是操作员,只是对机器进行操作,而无真正的交互活动。在计算机系统中人还是被称为用户。只有在VR系统中的人才,是主动的参与者。
人类生活中的事件都是多通道的,人-计算机多通道交互技术的发展虽然受到软件和硬件的限制,但至少要满足两个条件:其一,多通道整合,不同通道的结合对用户的体验是十分重要的;其二,在交互中容许用户产生含糊和不精确的输入。
⒈非精确的交互
· 语音(Voice) 主要以语音识别为基础,但不强调很高的识别率,而是借助其它通道的约束进行交互。
姿势(Gesture) 主要利用数据手套、数据服装等装置,对手和身体的运动进行跟踪,完成自然的人机交互。
头部跟踪(HeadTracking)主要利用电磁、超声波等方法,通过对头部的运动进行定位交互。
视觉跟踪(Eye-Tracking)对眼睛运动过程进行定位的交互方式。
⒉多通道交互的体系结构
多通道交互的体系结构首先要能保证对多种非精确的交互通道进行综合,使多通道交互存在于一个统一的用户界面之中,同时,还要保证这种通道的综合在交互过程中的任何时候都能进行。图1和图2表示了这两种不同的体系结构。良好的体系结构应能保证多个通道的综合不只是发生在应用程序这一级。
人机交互技术是目前用户界面研究中发展得最快的领域之一,对此,各国都十分重视。美国在国家关键技术中,将人机界面列为信息技术中与软件和计算机并列的六项关键技术之一,并称其为对计算机工业有着突出的重要性,对其它工业也是很重要的。在美国国防关键技术中,人机界面不仅是软件技术中的重要内容之一,而且是与计算机和软件技术并列的11项关键技术之一。欧共体的欧洲信息技术研究与发展战略计划(ESPRIT)还专门设立了用户界面技术项 目,其中包括多通道人机交互界面(MultiModal Interface for Man-MachineInterfa
ce)。保持在这一领域中的领先,对整个智能计算机系统是至关重要的。我们可以以发展新的人机界面交互技术为基础,带动和引导相关的软硬件技术的发展,使更有效地使用计算机的计算处理能力成为可能。
㈧ 中文输入法的发展历程
由于汉字有数以万计,电脑键盘不可能为每一个汉字而造一个按键。因此,人们需要替汉字编码(检索出汉字的代码),用数个键来输入一个汉字。中文输入法的发展过 程,是“万码奔腾”的过程,在30年间出现了上千种编码方法。
最早的汉字输入法,一般认为是从70年代末期或者80年代初期有了个人电脑PC开始诞生的,虽然更早有电报码,用0──9十个数字中的四位组合构成每一个汉字,便于邮电局发送电报之用,但通常意义上,人们还是认为从1981年国家标准局发布《信息交换用汉字编码字符集基本集》GB2312-80以来,个人计算机上开始使用五笔或者拼音输入汉字才是输入法广为使用的真正开始。在台湾的汉字输入法历史则可追溯至1976年由朱邦复发明之仓颉输入法开始。
汉字输入法的发展,一方面是输入法软件的功能的改进和完善,另一方面是新型输入法编码的不断涌现。前者主要是针对拼音输入法,后者则出现了“万码奔腾”的局面。早期的输入法软件大都为收费软件,很多企业或个人依靠销售输入法软件挣钱,如今收费的输入法已经很少,绝大多数输入法软件都是免费的产品。 拼音类的输入法包括大陆的拼音输入法和台湾的注音输入法等。拼音输入法相比其他输入法有着天然的优势,因为现代每一个接受教育的中国人在还没学习汉字前就先用大量时间学习汉语拼音或注音符号,原本只是用来标记汉字读音的拼音也就可以轻松地作为汉字的输入编码。拼音输入法另一个优势就是接近口语话,所以拼音输入法可以在极短时间内适应。
但是拼音输入法有着致命的弱点,就是汉字输入法编码时,单字重码率异常高,即使词组重码率也是非常高。为了让拼音能够较快速的录入汉字,只有借助复杂的输入法软件来提高拼音输入能力,比如支持智能排序,以词定字,整句输入,云输入功能等,纵观拼音输入法的发展,也即拼音输入法软件的发展。
在中文输入法诞生之初就最先出现拼音输入法,但是当时的拼音输入法软件功能差,字序固定,不支持词组和整句输入,甚至文字不能和编码一起显示。在输入汉字过程中常常要翻很多页才能找到需要的汉字,输入效率非常低下。虽然当时很多人都只会用拼音输入法,但大部分人都不满拼音输入法的输入效率。
20世纪90年代后,拼音输入法软件开始支持词组输入和整句输入。1993年出来的中文之星输入法软件能够做到单个字词的即时显示,即一边打拼音,同时显示汉字。中文之星软件进行一些巧妙设计,如空格确认、逗号句号选重码、允许模糊音容错和自定义字符串等,这些功能已经成为当今所有拼音输入法软件的必备功能。1993年初北京大学的朱守涛先生发明发明了智能ABC输入法,后被微软收购内置到Windows系统中。在随后几年中智能ABC输入法成为了中国大陆使用人数最多的输入法软件。
1994年的出来的自通输入法软件和1996年的黑马神拼输入法软件,这两种输入法都实现了汉字整句输入(又称语句输入)能力。汉字整句输入可追溯到20世纪80年代末期,哈尔滨工业大学在校博士生王晓龙进行了汉字分词方面研究,并申请了863课题,写出了“最小分词问题及其解法”方面的论文,从而奠定了拼音整句的输入的理论基础。微软从Windows 95中文版开始,在系统内置支持整句输入功能的“微软拼音输入法”。
然而当时的拼音输入法普遍智能化程度不高,整句输入不成熟,输入过程中错误率高,而且不能够与所敲拼音同步显示汉字(微软拼音是滞后一个字、自通是滞后几个字、黑马拼音是需要最后确认才出现汉字),整句输入过程中修改拼音选择汉字不方便,大大限制了整句拼音输入法的使用,所以很多用户还在继续智能ABC。直到1998年谭亚军发明的拼音之星软件,才完全支持“实时显示”的方式,不管输入多少拼音,每个字母按下去,汉字就同时显示,拼音有错误,用户就会立即发现,又由于支持自动分词与整句输入,用户不用去担心是输入一个词语还是一句话,系统都能够进行处理,如果没有该词语,系统也能够自动学习并存盘,似乎具有了词语输入法的方便性与整句输入法的智能性。到了1999年出现了另外几个拼音输入法软件:拼音加加、自由拼音输入法和考拉输入法,拼音加加软件开始支持在不切换输入法情况下直接用Enter直接键入英文字母
在90年代,双拼输入法和相应的输入法软件也得到了快速发展。双拼输入法诞生了多种方案,如自然码输入法软件提供的自然码方案,更采用双拼加偏旁或笔划的音形结合方式编码,提供了一种快速输入汉字的途经,这已经超出了拼音输入法的范畴,严格来说自然码双拼不属于纯拼音,而是一种音形码。此外微软、拼音之星、拼音加加、小鹤双拼等都提供了各自不同的双拼方案。
进入新世纪后,拼音输入法软件功能趋于成熟,正式进入了智能拼音输入法时代,这时产生的拼音输入法软件主要是整合以前拼音输入法软件优点,提供了更大的词库,软件的智能性也更强,还拥有了更强的学习能力。
2000年初出来的智能狂拼也提供了更智能的输入方式。而紫光拼音输入法是在考拉输入法的基础上开发而成,提供了一个更大的词库,增加了智能组词,也就是说用户连续输入9个字以内的拼音串,系统能够自动转换成汉字,而不论是否有这个词语,系统根据词频高频先见的方式给出一个词语串的组合。紫光输入法最终成了用户最喜欢的输入法之一。
随着互联网的快速发展,2006年6月由搜狐公司推出的一款Windows平台下的搜狗拼音输入法。搜狗拼音输入法是基于搜索引擎技术的新一代的拼音输入法产品,用户可以通过互联网备份自己的个性化词库和配置信息。搜狗拼音输入法一经出来很快取代了智能ABC输入法而成为中国现今主流汉字输入法。
在搜狗输入法出来后,谷歌、腾讯、网络和微软也相继推出了同一类型的智能拼音输入法:谷歌拼音输入法、QQ拼音输入法、网络输入法、必应输入法。
随着智能手机和平板电脑的流行,很多IT企业又开发了Android、iPhone、iPad的拼音输入法,如网络手机输入法、QQ手机输入法、搜狗手机输入法等。这些输入法延续了电脑上输入法的特点,同时输入法软件针对触屏的特点,从而提供了更为灵活的输入方式。
在台湾的拼音输入法则以注音输入法为主,与大陆类似都是在输入法软件方面不断得到完善和改进,变得更加智能。与大陆不同的是,大陆拼音输入法一致采用英文26键作为拼音输入法的键位,而台湾使用的注音输入法键位设置没有一个统一的标准,从40键到30键,再到26键都有人使用。因为注音符号与键盘的英文字母并不是一一对应的,所以注音符号设置键位的时候往往采用数字键和符号键作为编码。
在香港人则流行粤语拼音输入法(又名广东话输入法),利用汉字的粤语读音,在电脑上输入汉字。由于粤语拼音缺乏统一的拼音标准办法,各种软件的拼音法并不一致,故有碍粤语拼音输入法进一步的发展和普及。 虽然拼音输入法简单易学,但是汉字同音字现象之多所导致的重码率居高不下,即使输入词组重码也是相当高,纵然加上云输入功能也无法完全做到精确地输入文字,所以在拼音编码外就涌现了大量的编码方案,主要有形码和音形码两类,这些编码往往比拼音输入法具有更低的重码率,熟练后可以很快地输入汉字。中国大陆最早出现并流行开来的形码输入法是由王永民于1983年发明的五笔字型输入法。在台湾最早的形码输入法则是1976年由朱邦复发明之仓颉输入法。
电脑在中国普及,第一个急需要解决的问题就是,如何将汉字输入到电脑中,拼音虽然可以作为汉字的编码,制作成拼音输入法,但是很长一段时间拼音输入法的输入汉字效率极其低下。为了能够让中文快速的在电脑上输入,有的人抛弃英文键盘布局而另外设计了专门的中文键盘,这些键盘作为编码的键数量有的为几十个,甚至有的达到几百个,但是这些方案并没有实现中文的轻松或快速录入。
直到 1983年8月,王永民推出了划时代的五笔字型输入法。五笔输入法采用普通的电脑键盘,只使用英文字母键其中的25个参与编码,不但可以让我们输入汉字,而且也极大的解决了输入速度这一顽症。五笔字型完全依据笔画和字形特征对汉字进行编码,是典型的“形码”。五笔字型在发展过程中先后诞生了三种编码方案,即86版和98版和新世纪版。作为国内第一个推广的形码输入法,一经推出来,即受到很多用户的热捧,在80年代和90年代,很多人学习电脑的第一要务就是学习五笔字型输入法,五笔的教学培训班也遍地开花。
在80年后期还出现了另一个著名的形码输入法——郑码输入法。郑码是郑易里和女儿郑珑共同发明的一种中文输入法,郑码相比于五笔更加规范,而且郑码输入法要比五笔更加广泛,因为微软从Windows 95系统开始就内置郑码输入法,成为系统默认自带的输入法,直到2012年的Windows 8才取消内置郑码输入法。郑码推出后很快获得中、美、英国专利授权,并通过国家级的鉴定,曾荣获北京国际发明金奖和最优秀发明大奖;荣获第22届日内瓦发明金奖。为了解决繁体字与简体字通用的问题,郑码采用字根双编码方式减少字根重码,因采用按特征检索基根和区码方式以及大多采用标准的偏旁部首记忆量增加不大较为易学。
在80年代和90年代,由于国家教委尚未有推荐输入法方案,所以在中小学里教的汉字输入法相当多,各个学校教汉字输入法也不尽相同,有的教五笔字型,有的教自然码,有的教肖码等。虽然五笔字型输入法可以快速录入汉字,也在全国范围内得到较为广泛的商业推广,但是五笔因为学习难度高,而且五笔编码本身有不少存在不合理的地方,比如字根不符合汉字基本部件与违反笔顺的问题,所以一直无法成为国家教委的推荐输入法。
进入90年代后,国家教育委员会批准了关于研发输入法的“八五”重点攻关项目。在1992年8月1日至3日,国家教委基础教育司及直属的全国中小学计算机教育研究中心在北京召开了 “全国中小学教学汉字编码规范与计算机汉字输入系统”的研讨会。最后与会代表认为,在目前的中小学计算机教学中,应主要使用汉语拼音方案作为计算机汉字输入方法,而对形码的选择应持特别慎重态度,目的在于避免对语言文字的“污染”,并坚决反对用商业竞争或行政命令手段在中小学中强制推行不规范的汉字输入编码方案的做法。两年后项目课题组推出了名叫“认知码计算机汉字输入系统”的形码输入法, 1995年国家教委推荐中小学使用认知码,向全国中小学校全面推广。
可是,由于认知码自身存在很多欠缺,在推行之中遇到很大争议和阻力。不少学术刊物纷纷载文讨论认知码,因为认知码自身的致命缺陷,比如重码率相当高、编码规则复杂、易学性差、字根选择缺乏正确的规范、简码的使用不科学,使这种后来研制出的官方编码被批评家批驳得体无完肤,一蹶不振。最后认知码全面推广之事也不了了之。
在国家教委想方设法研发一种易学规范而又快速的输入法同时,一种更优秀的输入法——二笔输入法已经在民间诞生。二笔输入法是陈劲松于1992年发明的音形码输入法,采用拼音首字母与笔画(两个笔画取一键)相结合的方式取码。二笔输入法直到2000年1月成立的广东二笔软件有限公司向外界推出二笔输入法软件后,才正式出现在大众的视野中。二笔输入法不但易学,还可以输入文字打出像五笔一样速度。二笔输入法具有规范、易学、快速的特点,因此顺利通过国家教育部基础教育课程教材发展中心评审而获准进入中小学基础教材,这是截止2013年唯一获得批准进入中小学基础教材的汉字输入法。
由于广东二笔软件有限公司以高价销售二笔输入法软件,而且当时(2000年到2004年期间)已经得到广泛使用的智能ABC输入法和五笔输入法是免费的产品,只有很少人愿意尝试使用二笔。最终导致以经营二笔输入法软件为主要业务的广东二笔软件有限公司在2004年濒临倒闭。在另一方面,二笔输入法以其优秀的特性吸引了不少二笔爱好者,还有些爱好者对二笔进一步改进和优化,同时对二笔输入法软件进行维护。二笔输入法软件大都能够在互联网上免费获得和使用。
而随着智能拼音输入法时代的到来,特别是在2006年搜狗拼音输入法的诞生后,非拼音类的形码或音形码输入法受到的关注也就越来越少,而且不再有国家相关部门参与开发和推广输入法。但这并不影响众多输入法爱好者对输入法编码方案研究的热情。很多爱好者研究输入法都会从多面方面考虑,比如重码率、易学性、对大字库的支持、输入法按键的舒适程度等。
一些输入法爱好者仍然想得到一个超低重码率的输入法,所以也就产生了GB2312-80字符集的6763个汉字中只有14个重码字的张码输入法。在支持大字库方面,除了输入法编码本身外,更要输入法软件和字库或词库的支持,所以诞生了收录全部七万多个UNICODE汉字的海峰五笔软件。而在输入法编码方案易学方面,至今依然没有一个能够超越二笔输入法的编码方法,能够做到既高效又易学。
在台湾,中文输入法也出现了非常多的输入法编码方案。1976年朱邦复发明第一个形码输入法——仓颉输入法,发明输入法后,朱邦复公开该输入法,不收分文,使电脑汉化得到很大的进展。所以台湾的Windows操作系统都内置有仓颉输入法。也成为台湾最流行的形码输入法之一。成仓颉输入法出来之后又诞生了一批形码输入法,像王赞杰发明了大易输入法,廖明德发明了行列输入法,和仓颉输入法一样,这些输入法作者开放输入法专利,所以同样内置到了Windows系统中。在台湾使用人数最多的形码输入法是呒虾米输入法,这是在20世纪80年代后期,台湾人刘重次发明的一种形码输入法。 通常我们所说的输入法都指电脑普通键盘或手机键盘上的输入法,包括拼音、形码和音形码。除了这些通常意义的输入法外,还有语音输入、手写输入,以及速录技术等,这类输入法技术的发展既与普通键盘输入法发展息息相关,又独立于普通键盘输入技术。
汉字语音输入是利用语音识别技术将语音转换为文字的输入方法,通常是采用马尔可夫信息模型进行统计处理和基于规则方法进行歧义判别。20世纪90年代中后期,IBM终于推出非特定人连续语音识别系统ViaVoice,这是当时语音识别中的佼佼者。与此同时国内很多从事汉字语音识别研究的人员运用在研究所或大学学到的知识或研究成果,建立了巨大的中文语言资料库(又叫语料库),推出了中文普通话的语音输入系统。科大讯飞现已成为中国最大的智能语言技术提供商。在个人电脑上要实现语音输入中文往往还需要外接设备。而今随着智能手机的普及,很多智能手机的输入法都自带语音输入功能,如网络手机输入法、讯飞语音输入法等都具有语音输入的方法,用户也可以方便地利用手机进行语音输入文字。但是,语音输入有还不能提高非常精确的文字输入。
除了语音输入文字外,手写也是一种常见的输入汉字方法。手写输入法是在手写板或触屏手机屏幕直接书写的中文输入方式。1997年就已经出现了基本可以使用的手写汉字输入系统,采用了基于语义句法的模式识别方法。20世纪90年代也诞生了不少手写产品,比如中自公司的“汉王99”和摩托罗拉公司的“慧笔”。但是在随后几年里手写并没有得到广泛使用,直到触屏手机的出现,特别是在智能手机和平板流行后,手写输入法才得到更加广泛使用。
速录技术严格来说并不属于输入法编码方法,速录所用到的编码方法实际上也就主要为三种:拼音、形码和音形码。速录一般面向特定的领域,速录师就业面向政府机关、司法系统。这些领域对于文字的录入速度要求比较高,特别是在会议,速录师可以边听边将文字打出来,就像文字立即出现在眼前。另外速录的键盘通常也不同于普通键盘,而采用速录键盘,如亚伟速录采用国际通用的速录键盘。
亚伟速录是最早的一种中文速录技术,采用拼音输入方式,由唐亚伟于1993年发明。亚伟速录也是如今最广泛的中文速录技术。在亚伟速录之后又出现了其他多种速录技术,如国育速录、超音速录、飞耀速录、五笔双打等。
虽然速录使用的编码方案通常为拼音方案(也有少数采用五笔或二笔方案),经过特殊的编码组合,但是大多数都采用并击技术,并击需要每次多个手指分别按下多个不同的键,可以有效地提高击键效率,从而也就突破了普通键盘每分钟200到300字的极限速度,而达到每分钟600字以上的速度。
㈨ 信息科技的发展史
我不知道找的对不对,你看看哈`,对的话被忘了给我加分信息技术 信息技术:Information Technology(英文) 简称IT 凡是能扩展人的信息功能的技术,都是信息技术。可以说,这就是信息技术的基本定义。它主要是指利用电子计算机和现代通信手段实现获取信息、传递信息、存储信息、处理信息、显示信息、分配信息等的相关技术。 具体来讲,信息技术主要包括以下几方面技术: 1.感测与识别技术 它的作用是扩展人获取信息的感觉器官功能。它包括信息识别、信息提取、信息检测等技术。这类技术的总称是“传感技术”。它几乎可以扩展人类所有感觉器官的传感功能。传感技术、测量技术与通信技术相结合而产生的遥感技术,更使人感知信息的能力得到进一步的加强。 信息识别包括文字识别、语音识别和图形识别等。通常是采用一种叫做“模式识别”的方法。 2.信息传递技术 它的主要功能是实现信息快速、可靠、安全的转移。各种通信技术都属于这个范畴。广播技术也是一种传递信息的技术。由于存储、记录可以看成是从“现在”向“未来”或从“过去”向“现在”传递信息的一种活动,因而也可将它看作是信息传递技术的一种。 3.信息处理与再生技术 信息处理包括对信息的编码、压缩、加密等。在对信息进行处理的基础上,还可形成一些新的更深层次的决策信息,这称为信息的“再生”。信息的处理与再生都有赖于现代电子计算机的超凡功能。 4.信息施用技术 是信息过程的最后环节。它包括控制技术、显示技术等。 由上可见,传感技术、通信技术、计算机技术和控制技术是信息技术的四大基本技术,其中现代计算机技术和通信技术是信息技术的两大支柱。 摘自《江苏科技咨询网》 信息技术是指有关信息的收集、识别、提取、变换、存贮、传递、处理、检索、检测、分析和利用等的技术。凡涉及到这些过程和技术的工作部门都可称作信息部门。 信息技术能够延长或扩展人的信息功能。信息技术可能是机械的,也可能是激光的;可能是电子的,也可能是生物的。 信息技术主要包括传感技术,通信技术,计算机技术和缩微技术等。 传感技术的任务是延长人的感觉器官收集信息的功能;通信技术的任务是延长人的神经系统传递信息的功能;计算机技术则是延长人的思维器官处理信息和决策的功能;缩微技术是延长人的记忆器官存贮信息的功能。当然,这种划分只是相对的、大致的,没有截然的界限。如传感系统里也有信息的处理和收集,而计算机系统里既有信息传递,也有信息收集的问题。 目前,传感技术已经发展了一大批敏感元件,除了普通的照相机能够收集可见光波的信息、微音器能够收集声波信息之外,现在已经有了红外、紫外等光波波段的敏感元件,帮助人们提取那些人眼所见不到重要信息。还有超声和次声传感器,可以帮助人们获得那些人耳听不到的信息。不仅如此,人们还制造了各种嗅敏、味敏、光敏、热敏、磁敏、湿敏以及一些综合敏感元件。这样,还可以把那些人类感觉器官收集不到的各种有用信息提取出来,从而延长和扩展人类收集信息的功能。 通信技术的发展速度之快是惊人的。从传统的电话,电报,收音机,电视到如今的移动电话,传真,卫星通信,这些新的、人人可用的现代通信方式使数据和信息的传递效率得到很大的提高,从而使过去必须由专业的电信部门来完成的工作,可由行政、业务部门办公室的工作人员直接方便地来完成。通信技术成为办公自动化的支撑技术。 计算机技术与现代通信技术一起构成了信息技术的核心内容。计算机技术同样取得了飞速的发展,体积越来越小,功能越来越强。从大型机,中型机,小型机到微型机,笔记本式计算机,便携式计算机等。从PC 机,286,386到486,586等,计算机的应用也取得了很大的发展。例如,电子出版社系统的应用改变了的传统印刷、出版业;计算机文字处理系统的应用使作家改变了原来的写作方式,称作“换笔”革命;光盘的实用使人类的信息存储能力得到了很大程度的延伸,出现了电子图书这样的新一代电子出版物;多媒体技术的发展使音乐创作、动画制作等成为普通人可以涉足的领域。 国外的缩微技术发展很快,美国是缩微技术最发达的国家。例如闻名世界的美国UMI 公司是一个收集、贮藏,以及提供文献检索的出版公司,其服务范围包括近一百五十万册历代书籍、期刊、博士论文、档案以及原件。它的产品不但包括印刷品、缩微平片,而且提供机读信息。第二次世界大战期间,该公司利用所谓缩微技术,抢救了大英博物馆的许多珍贵文献。迄今为止,该公司存有自15世纪至今的10万种世界各地的绝版书