尽管2023年才过完了一半,但来自AI领域的科技震撼却没有要结束的意思。回顾过往,AI从没像今天这般那样受人瞩目,似乎一夜之间,它就成了新的科技方向。
当然,眼下大家所谈及的AI,更多是以Chat GPT为代表的,一种基于人工智能技术驱动的自然语言处理工具。它能对话,能画图,能胜任各种工作;它懂逻辑,擅推理,甚至可以解读人的情绪和态度,如此种种,一步步填补了我们对真实AI的向往。
AI在拍照中的应用
其实聊到AI,大部分用户都不会陌生。我们每天手机不离手,而大家最开始接触AI应用,很多都是来自智能手机,其中最具代表的当属手机影像了。
在手机拍照过程,AI的作用称得上立竿见影。以小米13为例,当我们进入到相机界面,在下拉菜单项中,会有一个“AI相机”字样的选项。
开启AI功能后,我们会发现照片的色彩更明艳,饱和度更高,亮度也有所变化。有了这个功能,当你按下快门的那一刻,手机就会根据此时此刻的拍摄场景自动计算出最优方案,从而直接“P”出一张成片,省去了后期的步骤。
如果只是做到这一点,显然是不够的。随着智能手机AI能力的变化,在手机影像上,有AI参与的场景可以说是越来越深入,越来越频繁。
其中,夜景就是一个十分典型的场景。众所周知,CMOS的面积越大,进光量就越多,夜景照片成像质量自然就越好。但受限于机身的尺寸,手机内部很难塞下更大尺寸的传感器和光学镜头,光线越复杂,图像就容易产生噪点,看上去很模糊,手机拍夜景就会显得愈发力不从心。
但事实上,我们发现手机拍摄夜景其实是很能打的,甚至不输一些专业设备。为什么会这样呢?答案一目了然,自然还是与AI有关。
有了AI参与之后,手机拍摄的夜景照片就不再是单次曝光所得,而是连续拍摄多张不同参数下的照片,然后进行堆栈,进而合并成一张样张。这个过程还是比较复杂的,但利用AI可以快速找出样张中的特征点进行校准,再将多帧画面进行合成,有效去除噪点以及提升画面细节。
除了AI模式、夜景模式等基本应用外,随着AI能力的提升,也衍生出了万物追焦、疾速抓拍、魔法换天、背景虚化等进阶应用,大大丰富了手机相机的玩法,提升了拍摄体验。
万物追焦
就比如万物追焦,稳定精准智能可持续地追焦能力特别适合拍摄运动中的物体,如果家中有活泼好动的小孩子或者宠物,这个功能简直不要太好用。
魔法换天
还有魔法换天,你可以给相册中的照片编辑各式各样的天空效果,拍不出星轨没关系,可以后期一键生成,拍不到圆月也没关系,一键生成一个就完事了,甚至还能一键加入闪电、落日、极光、银河……不仅玩法新颖,看上去也是毫无违和感。
AI在日常生活中的应用
那么除了在拍照时,在日常使用时,又有哪些场景会用到AI呢?
其实还真不少,就比如在小米手机中,有一个很有意思的AI应用,可以说是我自己的最爱之一,它就是AI通话。
当有电话打进来时,我们无法接听,但又不想错过,或者总被营销电话骚扰不胜其烦,遇到这种情况,“小爱通话”就可以帮助我们很好完成“接听”工作。
对于MIUI用户来说,大家对小爱同学并不陌生,但应该很少有人知道它还有这种用途。简单来说,这就是一个基于AI技术的自动通话功能,接听后,小爱会识别对方所说的内容,用AI语音进行回复,在通话结束后,还会把对话过程通过文本形式记录下来,方便我们后期查看。
当大家追剧时,如果看到自己很喜欢的英剧美剧,却发现没有翻译字幕,肯定就要遗憾错过了。
同样在小米手机中,用户可以开启“小爱翻译”,找到“实时字幕”功能,这样在观看视频就会实时生成双语字幕。
实时翻译
从实际体验来看,它的翻译速度和准确性都很高,基本不影响理解。而且不仅仅追剧,在线直播、视频会议等场景都有不错的表现,可以说是AI在实际用机过程中颇具代表性的一个应用场景。
其实AI在手机中的使用场景还有很多,比如AI辅助信号增强,通过AI侦测用户手部使用习惯,可以更准确地侦测使用场景,从而实现更低的通话掉线率、更快的数据传输速率、更广的网络覆盖和更长电池续航;还有智能语音助手、照片分类整理、AI视频剪辑、面部解锁等等,满足了用户用机过程中的各种需求。
手机上AI的来自哪?
不过,AI这么强大实用,但它也不是凭空而来的。我们前面谈到的一系列AI用例都来自小米13,那么小米13的AI能力又来自哪里呢?
这就要说到它所搭载的第二代骁龙8移动平台了,第二代骁龙8移动平台搭载了一颗专门面向AI计算的Hexagon处理器,和以往不同,这次高通不但为Hexagon处理器设计了独立的供电系统,它的架构也有所变化,使其能够更好支持Transformer网络在终端侧的推理能力。
大家还记得小米13上的实时字幕功能吗,它之所以能够在本地呈现出快速准确的翻译效果。也正是凭借Hexagon处理器硬件性能的提升,使得第二代骁龙8移动平台成为了业内最先达到INT4精度的移动平台,与INT8精度相比,INT4带来的是90%的AI推理性能提升以及60%的能效提升,这使得第二代骁龙8,在自然语言处理用例下,能够实现4.35倍的AI性能提升。
除了Hexagon处理器外,在第二代骁龙8移动平台中,传感器中枢能力同样得到加强,实现AI性能的翻倍。一般来说,传感器中枢主要承担一些低功耗轻负载的任务,如大家熟悉的语音助手、视觉唤醒和图片分类之类的。
而在第二代骁龙8中,厂商能够围绕传感器中枢打造更为丰富的应用场景,比如息屏状态下也能快速扫二维码,或者实时监测是不是有陌生人正在偷窥你的手机屏幕,并及时关闭消息通知等等。
在影像方面,第二代骁龙8移动平台在Hexagon处理器和ISP之间,增加了一个名为“Hexagon直连”的物理连接,打造了移动行业首创的“认知ISP”,并带来了“实时语义分割”技术。
“语义分割”可以对画面中不同区域、不同元素进行单独的渲染处理,比如区分拍摄主体和不同的背景,或者在人像拍摄中,对被拍摄者的皮肤和五官进行单独修饰,它的处理过程是实时的,而且速度非常快,用户按下快门后,就能立马得到想要的照片,不用等待。
最后:
AI作为近年来最火热的一个领域,吸引了包括高通在内的许许多多科技公司的关注。如今,高通在AI领域已经走在了行业的最前沿,以骁龙移动平台为代表的一系列产品正不断刷新着移动端AI算力的新纪录,并且除了智能手机外,高通在XR、汽车、PC、物联网等领域同样有着广泛的布局,可以预见,终端侧AI即将迎来新一轮的巨大变革,直至彻底改变用户的使用体验。
值得一提的是,高通在6月16日正式发布了《混合AI是AI的未来》白皮书,明确表示在云端和终端进行分布式处理的混合AI才是AI的未来。另外,高通也谈到随着强大的生成式AI模型不断缩小,以及终端侧处理能力的持续提升,混合AI的潜力将会进一步增长,前景可以说是十分光明。
总的来说,无论从实际体验上,还是白皮书中所阐述的,高通在终端侧AI方面确实有很大优势,而且要知道,全世界搭载骁龙和高通平台的已上市用户终端有几十亿台,每年还有数亿终端产品涌入。也正是得益于高通AI技术的支持,今天的手机、汽车、XR等等智能设备已经表现得非比寻常,假以时日,随着终端AI能力不断提升,打造一个触手可及的AI世界,似乎也没那么遥远。