如同扎克伯格在Facebook页面上说的,Jarvis是他个人的挑战,从设计的过程中他可以知道更多AI技术现况;他并指出,该系统采用了数种AI技术:“包括自然语言处理、语音识别、脸部识别,以及强化学习(reinforcement learning);以Python、PHP与Objective C 等语言撰写。”

在读到他如何打造Jarvis时,有五件事情打动了我

20161226-Jarvis-1 第一,他再次展现自己是个精明能干的软件工程师。我确信有很多科技产业的执行长也都拥有工程教育背景,他们在周末也会在地下室的工作台上当“修补工”;在两年前我写过当时Marvell的执行长Sehat Sutardja,他说他在闲暇时间开发一种新的互连技术MoChi,而Jarvis开发案让我发现扎克伯格跟Sutardja一样,是个大老板级的修补工。

第二,扎克伯格的Facebook贴文中最有趣的地方,是他的AI开发案暴露了一些基础性的问题,不过与AI不相关,是跟“联网家庭”有关。对扎克伯格来说,AI反而是比较简单的部分,比他预期更复杂的是:“简单地与我家所有不同的系统链接与通信。”

所以说,甚至是在展开AI系统的开发之前,扎克伯格不得不先花好几小时写程序,以链接那些“语言不通”、并非采用相同通信协议的家用电器。例如扎克伯格说:

“我们的照明、恒温器还有门,是用Crestron系统;播放Spotify串流音乐是用Sonos系统;有一台三星(Samsung)电视、一台我女儿Max用的Nest摄影机,还有当然我的工作是与Facebook的系统链接。”

他还提到:“我不得不把其中的一些API做逆向工程,甚至只为了达到我能从计算机发出指令打开灯,或是播放某一首歌的目的。”而对我们这些不会写程序的人来说,除非只买支持三星SmartThings、或是苹果(Apple) HomeKit的各种家电,没有别的办法可以实现所谓的“联网家庭”──但当然,那是不会发生的!

扎克伯格还发现一个比各种“智能家电”不具备互操作性更大的问题:“大多数的家电甚至还不能连结互联网。”

我被他对烤面包机的讨论逗笑了:“有可能采用联网电力开关来控制某些不联网的家电,让你可以在远程打开电源,但通常这是不够的;例如很难找到一台烤面包机,是在你把电源关闭时就让吐司片下降,所以当电源打开时就能自动开始烤。”有解决方案吗?最后扎克伯格找了一台有60年历史的烤面包机(模拟式的),并用一个联网开关来操纵它。

第三,一旦扎克伯格可以着手进行AI系统开发,他实际上提供了不少实用的AI相关发现以及至理名言,包括:

•对任何一种AI应用来说,了解其来龙去脉非常重要;

•扎克伯格用Facebook Messenger打造了一个Messenger机器人用来跟Jarvis沟通,如此就能用手机发讯息给Jarvis,那些讯息会立即在Jarvis服务器回放并被处理;

•文字vs.语音──扎克伯格发现自己跟Jarvis之间的沟通是文字多于语音;

•扎克伯格设置了一个两阶段步骤,Jarvis能识别门外访客的人脸(首先是执行脸部侦测,看是不是有人进入视野,接着是找到人脸并执行脸部辨识、看访客是谁);

•文字在与AI的沟通上,比大多数人所想象的、扮演更重要的角色,但语音也很实用,因为非常快速;扎克伯格写道:“你不需要把手机拿起来、打开应用程序然后开始打字,你只要讲话就好了。”但是为了实现对Jarvis的语音控制:“我得先打造一个Jarvis专属应用程序,能一直聆听我说的话;”Messenger机器人能在很多事情上表现优异,但使用语音有太多磨擦。

第四,我发现扎克伯格最后的结论真是无价,因为他非常直率地指出了AI技术目前的状况:“我今年花了100个小时来打造Jarvis,现在我有一个相当棒的系统,听得懂我的话而且能做很多事情;但就算我再花1,000个小时,我大概还是没办法打造一套能自己学习全新技能的系统──除非我能在目前的AI技术上达到某种基础性的突破。”

第五,在看到Jarvis目前在扎克伯格家做的工作,我忍不住想:“就酱?”

简单来说,那些他透过联网设备并教Jarvis做的事情,看来都是花了大量劳力来省力,而且就算没有Jarvis也不是难事。我的意思是说,花了上百小时撰写客制化程序来启动音频系统、应门、打开烤面包机还有监视婴儿房,真的有比较快、比较有效率吗?其实扎克伯格是不是只要花几秒钟就可以把他不联网的尊臀从椅子上移开,然后手动把所有那些事情都做得很好?

20160719-ESMC-1