iPhoneAI初版发布:付费开发者专享的智能革命

  • 时间:
  • 浏览:0
  • 来源:立信远航网络科技

人工智能与设计(一):AI 发展历史的今日更新是一个不断变化的过程,它涉及到许多方面。今天,我将与大家分享关于人工智能与设计(一):AI 发展历史的最新动态,希望我的介绍能为有需要的朋友提供一些帮助。

文章目录列表:

人工智能与设计(一):AI 发展历史

姓名:饶明磊

学号:19021210815

嵌牛导读随着人工智能的兴起,设计师会不会担心自己被取代?

嵌牛鼻子机器学习 深度学习 创意设计

嵌牛提问人工智能对设计起到辅助作用还是会完全取代设计师?

嵌牛正文人工智能的发展历史

本人业余偶尔做一些设计、摄影之类的艺术活动,经常接触到一些创意软件,发现最近几乎每一款创意软件的重磅更新都体现在了人工智能算法的加入。包括本人从事的研究领域,相关调试软件也是在不断加入人工智能调试算法,更加智能化了。从设计方面着手,我在想,以后人工智能会不会完全取代设计师和工程师呢?

为了更好理解人工智能和设计的关系,我开始涉猎一些机器学习、深度学习等方面的知识,并且和相关专业的同学探讨这个方面的话题,从当初觉得人工智能只会让大部分设计师失业,到现在觉得人工智能只是一个设计的辅助工具,也算是成长了不少。

这个专题将分成三个部分来调研,用三篇文章较为详细地将 AI 的历史、定义以及和设计之间的关系和影响呈现给大家。

说起人工智能(AI:Artificial Intelligence)这词,不得不提及人工智能的历史。人工智能的概念主要由Alan Turing提出:机器会思考吗?如果一台机器能够与人类对话而不被辨别出其机器的身份,那么这台机器具有智能的特征。同年,Alan Turing还预言了存有一定的可能性可以创造出具有真正智能的机器。(说明: Alan Turing (1912.6.23-1954.6.7)曾协助英国军队 了德国的 密码系统Enigma,帮助盟军取得了二战的胜利。因提出一种用于判定机器是否具有智能的试验方法,即图灵试验,被后人称为计算机之父和人工智能之父。)

1956年,在达特茅斯学院举行的一次会议上,不同领域(数学,心理学,工程学,经济学和政治学)的科学家正式确立了人工智能为研究学科。

2006年达特茅斯会议当事人重聚,左起:Trenchard More、 John McCarthy 、 Marvin Minsky 、Oliver Selfridge、Ray Solomonoff

达特茅斯会议之后是大发现的时代。对很多人来讲,这一阶段开发出来的程序堪称神奇:计算机可以解决代数应用题、证明几何定理、学习和使用英语。在众多研究当中,搜索式推理、自然语言、微 在当时最具 。

大量成功的AI程序和新的研究方向不断涌现,研究学者认为具有完全智能的机器将在二十年内出现并给出了如下预言:

1958年,H. A. Simon,Allen Newell:“十年之内,数字计算机将成为国际象棋 。” “十年之内,数字计算机将发现并证明一个重要的数学定理。”

1965年,H. A. Simon:“二十年内,机器将能完 能做到的一切工作。”

1967年,Marvin Minsky:“一代之内……创造“人工智能”的问题将获得实质上的解决。”

1970年,Marvin Minsky:“在三到八年的时间里我们将得到一台具有人类平均智能的机器。”

美国政府向这一新兴领域投入了大笔资金,每年将数百万美元投入到麻省理工学院、卡耐基梅隆大学、爱丁堡大学和斯坦福大学四个研究机构,并允许研究学者去做任何感兴趣的方向。

当时主要成就:

神经网络机、 台机器人被制造出来了;贝尔曼公式( 增强学习 雏形)被提出;感知器( 深度学习 雏形)被提出;搜索式推理被提出

然而遇到了 次寒冬(1974年—1980年)

70年代初,AI遭遇到瓶颈。研究学者逐渐发现,虽然机器拥有了简单的逻辑推理能力,但遭遇到当时无法克服的基础性障碍,AI停留在“玩具”阶段止步不前,远远达不到曾经预言的完全智能。

当时主要问题:

计算机运算能力有限,解决不了超大型的计算问题,同时人们对 的认知还不够充分

当时有一个莫拉维克悖论:如果机器像数学天才一样下象棋,那么它能模仿婴儿学习又有多难呢?然而,事实证明这是相当难的。

1987年,AI 硬件的市场需求突然下跌。科学家发现, 系统虽然很有用,但它的应用领域过于狭窄,而且更新迭代和维护成本非常高。同期美国 le和IBM生产的台式机性能不断提升,个 脑的理念不断蔓延;日本人设定的“第五代工程”最终也没能实现。人工智能研究再次遭遇了财政困难,一夜之间这个价值五亿美元的产业土崩瓦解。

当时主要问题:

1.受到台式机和“个 脑”理念的冲击影响

2.商业机构对AI的追捧和冷落,使AI化为泡沫并破裂

3.计算机性能瓶颈仍无法突破

4.仍然缺乏海量数据训练机器

在摩尔定律下,计算机性能不断突破。云计算、大数据、机器学习、自然语言和机器视觉等领域发展迅速,人工智能迎来第三次 。

摩尔定律起始于Gordon Moore在1965年的一个预言,当时他看到因特尔公司做的几款芯片,觉得18到24个月可以把晶体管体积缩小一半,个数可以翻一番,运算处理能力能翻一倍。没想到这么一个简单的预言成真了,下面几十年一直按这个节奏往前走,成为了摩尔定律。

主要事件

1997 年:

IBM的国际象棋机器人深蓝战胜国际象棋 卡斯帕罗夫

2005 年:

Stanford开发的一台机器人在一条沙漠小径上成功地自动行驶了131英里,赢得了DARPA挑战大赛头奖;

2006 年:

1.Geoffrey Hinton 提出多层神经网络的深度学习算法

2.Eric Schmidt在搜索引擎大会提出“云计算”概念

2010 年:

Sebastian Thrun领导的谷歌无人驾驶汽车曝光,创下了超过16万千米无事故的纪录

2011 年:

1.IBM Waston参加智力游戏《危险边缘》,击败最高奖金得主Brad Rutter和连胜纪录保持者Ken Jennings

2.苹果发布语音个人助手Siri

3.Nest Lab发布 代智能恒温器Nest。它可以了解用户的习惯,并相应自动地调节温度

2012 年:

Google发布个人助理Google Now

2013 年:

深度学习算法在语音和视觉识别率获得突破性进展

2014 年:

1.微软亚洲研究院发布人工智能小冰聊天机器人和语音助手Cortana

2.百度发布Deep Speech语音识别系统

2015 年:

1.Facebook发布了一款基于文本的人工智能助理“M”

2016 年:

1.Google AlphaGo以比分4:1战胜围棋九段棋手李世石

2.Chatbots这个概念开始流行

3.Google发布为机器学习定制的 代专用芯片TPU

4.Google发布语音助手Assistant

2017 年:

1.AlphaGO在围棋网络对战 以60连胜击败 各地高手

2.Google开源深度学习系统 Tensorflow 1.0正式发布

3.Google AlphaGo以比分3:0完胜 围棋九段棋手柯洁

4.默默深耕机器学习和机器视觉的苹果在WWDC上发布Core ML,ARKit等组件

5.Google发布了ARCore SDK

6.百度AI开发者大会正式发布Dueros语音系统,无人驾驶 Apollo1.0自动驾驶

7.华为发布全球 款AI移动芯片麒麟970

8.iPhone X 配备前置 3D 感应摄像头(TrueDepth),脸部识别点达到3W个,具备人脸识别、解锁和支付等功能;配备的A11 Bionic神经引擎使用双核设计,每秒可达到运算6000亿次

9.AlphaGo Zero完全从零开始,不需要任何历史棋谱的指引,更不需要参考人类任何的先验知识,仅需要4个TPU,并花三天时间自己左右互搏490万棋局,最终无师自通完爆阿法狗100-0

很多 学者对此次人工智能浪潮给予了肯定,认为这次人工智能浪潮能引起第四次工业革命。人工智能逐渐开始在保险,金融等领域开始渗透,在未来健康医疗、交通出行、销售消费、金融服务、媒介娱乐、生产制造,到能源、石油、农业、政府……所有垂直产业都将因人工智能技术的发展而受益,那么我们现在讲的人工智能究竟是什么?

详情参见下一篇:人工智能与设计(二):AI 是什么?

说到车内智能系统,车圈的朋友估计 时间都会想到斑马、安卓,更硬核的会说出黑莓的QNX、腾讯长安合作的梧桐车联、百度的DuerOS甚至吉利亿咖通的GKUI。但有这样一家公司,它的名字并不为大众熟知,即使是汽车业内人士,也不是所有人都对它知晓。但正是这样一家公司,2019年全球半数以上生产的汽车都搭载了它家的技术,它的名字就是Cerence。

Cerence是何方神圣?

可能Cerence这个名字普通消费者不熟悉,但Nuance的名字专业人士一定不会陌生。Nuance公司(Nuance?Communicati ,?Inc.?NASDAQ:?NUAN)?是全球最大的专门从事语音识别软件、图像处理软件及输入法软件研发、销售的公司。 的电脑语音识别软件NaturallySpeaking就出自于Nuance公司。

如果说到这里您还是没有概念,那咱们再举一个通俗易懂的例子:你一定知道iPhone?4S带来了一项革命性的人机交互产品——"Siri"。事实上,为"Siri"提供语音数据库支持的正是Nuance(苹果曾用过一段Vlingo ,后来该 被Nuance收购)。

作为立足全球的语音和语言解决方案提供商,Nuance的另一个产品或许更为出名——T9输入法。一度全球90%以上的手机都采用T9输入法,这个输入法原本是一家名为"Tegic?Communicati "所开发,后来被Nuance买了下来。这套输入法的最大优势是支持超过70种语言,超过30亿部移动设备内置T9输入法。已成为业内认同的标准输入法,被众多OEM厂商内置,包括诺基亚、索爱、三星、LG、夏普、海尔、华为等等。

汽车业务作为Nuance在2B业务中的核心业务之一,20年前就已开始。截至目前,包括奔驰、宝马、奥迪、福特、通用、上汽、吉利等企业仍然是其客户,而全球已有约3亿辆汽车都搭载了这家企业的技术。

为了将汽车业务做专做精,在2019年,Nuance宣布将汽车业务板块拆分上市,拆分后的上市公司便是Cerence。Cerence是一个新创的名字,其寓意结合了智慧(intelligence)、体验(experience)、从容(serenity)和掌控(control)。而在拆分后不到三个月的时间内,Cerence就在2020年的CES上交出了 份答卷。

不懂前沿硬件的智能软件开发者不是语音识别好帮手

回溯iPhone的发迹史,其最终的成功并不是源于硬件的创新。毕竟在早期的Palm或微软的掌上电脑,也配备了了触控大屏,摄像头,搭载智能系统,但这些并没有让他们生存到现今。真正使iPhone名声大噪并广为普及的,是OTA的成功与 store的出现。硬件打好基础,软件赋予灵魂;这就意味着,谁能够将软件与硬件的性能充分发挥出来,才有可能促成真正的创新与变革。

作为语音识别领域的老兵,Nuance在这一领域曾经称霸一方,但随着大数据技术的兴起,苹果谷歌等巨头的参战与挖角,让细分领域的霸主Nuance也曾失意一时。不过,恰是这样的竞争,促使Nuance站在更高的事业,去重新审视语音识别业务和它的未来。语音识别的目的,是在于让人与机器的交互更加简单直接。如果以语音识别技术为切入点,配合大数据解析和人工智能算法,再辅以诸如HUD、摄像头、全息投影等智能硬件,打造出一套融合视觉、听觉、手势在内的整体交互方案或许更具竞争力!因为L3级及以上的自动驾驶汽车内,驾驶员的精力将从驾驶中解放出来,着眼于未来的智能交互整体解决方案才是制胜的关键。

在CES?2020?上,?Cerence?推出了面向汽车制造商的解决方案——Cerence?Drive?升级版。它更像一个超级智能的贾维斯(钢铁侠的智能语音助手),能实现诸如车辆控制、导航设定等常规功能,也可以通过凝视车窗外的一个目标,获取车外兴趣点的介绍和相应的服务功能。比如摄像头会通过观察驾驶员的眼神,按照其凝视的方向,与车辆所处的定位信息进行比对,以确定其所凝视的建筑或者风景到底是什么,并根据这个坐标来提供相应的服务;如饭店桌位预定,**门票购买,抑或是风景的介绍。同时,驾驶者也可以像**《碟中谍4》里,汤姆克鲁斯一样,使用手势来移动、选择在挡风玻璃上显示的部件,进行导航、音乐播放、查询天气等操作。驾驶者还可以通过抓取、投掷手势并结合凝视的方式,将导航窗口部件移动至乘客面前的挡风玻璃处,这样乘客就可以扮演"副驾驶"的角色。驾驶者也可以使用点击手势暂停和继续播放音乐,或者播放下一首曲目。

此次Cerence的交互展示不仅 于车内,其联合e.GO?MOOVE?GmbH、e.GO?Digital?GmbH?以及?Saint-Gobain?Sekurit打造的一辆e.GO?Mover?自动驾驶电动巴士展示了车外人机交互的创新方案。结合多语言自动语音识别、自然语言理解和响应、语音合成、语音信号增强及?Saint-Gobain?Sekurit透明屏幕技术,人们在车外可以把玻璃作为显示屏,与汽车进行交互,这一技术为消费者更安全更 地与自动驾驶汽车进行沟通提供了新的思路。

细看这两套方案中的技术,包含视线跟踪、手势识别、声源定位、声纹定位以及风挡显示屏、侧窗投影等,而应用到的硬件包含车内摄像头、车内玻璃投影、车内触控屏幕等硬件。如果和前文中提到的多家国内企业做比较,笔者认为无论哪一方都在软件层面做出了非常巨大的努力,但是在软件与硬件结合的层面,或许Cerence带来的CES展品更具启迪效应。而只有将软件与硬件的结合做实做透,才是未来能否产生革命的关键。

面向中国的大胆布局

Cerence?在独立之后,对组织架构进行了大范围调整。根据Cerence?大中华区高级产品总监刘锋的介绍,目前,Cerence?业务主要分为核心汽车技术单元(Core?Automotive?BU)、成长型业务和前沿技术单元(Growth?and?Advance?Technology?BU),以及专业服务单元(?Professional?Services?BU?)?三大版块。其中成长型业务和前沿技术业务由大中华区负责,总部在上海,并在成都和北京设有分公司,在中国总部,能够看到很多曾经在上汽、东风等传统主机厂服务过的技术人员,他们对中国汽车产业有着深刻的理解。所以,中国总部在国内拥有完整的产品、研发、工程、销售和服务能力,且有着较高的自主权,这大大改进了原?Nuance?体制下的复杂行政及业务流程,使中国团队有了更高的执行效率和创新活力。

在这样的体制优势下,?Cerence?在中国的发展可谓快速。例如在本届?CES?上,他们就展出了2019年年底率先在中国发布的Cerence?ARK。这是一套专门为中国汽车制造商打造的语音AI交钥匙解决方案。这套方案支持多语言的语音交互基础功能,并适用于所有主流的车载 和操作系统。

Cerence?ARK最大的亮点是其集成了核心语音助理功能,包括唤醒词、声纹验证、自动语音识别、自然语言理解和文字转语音,并具有开放、灵活和快速部署的优势,是投入成本最低、开发时间最短、系统性能最优的选择。通过这套方案,汽车制造商可以 为客户打造个性化的驾乘体验,通过系统自带的人工智能学习能力,帮助驾驶者和乘客轻松的定制音乐、导航、兴趣点、新闻推送等内容访问。

该解决方案共有三个服务级别--轻量、标准和高级,并附带三个关键组件--?ARK?Edge、ARK?Client和ARK?Cloud。整车企业和供应商可以灵活选择组件和部署选项。由于整体解决方案仅需要小量自定义即可交付,大幅缩短上市周期,能够帮助汽车制造商和供应商实现快速增值,在市场上颇受欢迎。除中国的多家整车集团外,海外车企业也对这个中国团队主导的项目颇感兴趣。近日,LG?就宣布其webOS?Auto?车载信息娱乐系统将搭载?Cerence?ARK。

但这只是这家公司拆分过后不足半年的业绩,随着时间的积累,拆分后的Cerence预计会在中国市场有着更多的表现力。而对于源于互联网公司的汽车智能产业新进者,Cerence无疑是一个强劲的对手。

本文来源于汽车之家车家号作者,不代表汽车之家的观点立场。

好了,关于“人工智能与设计(一):AI 发展历史”的话题就讲到这里了。希望大家能够对“人工智能与设计(一):AI 发展历史”有更深入的了解,并且从我的回答中得到一些启示。