电话: 邮箱:

开云足球世界杯中国官网入口 讯飞首款 AI 眼镜,用 40 克撬动 AI 职责流

发布日期:2026-05-29 02:14 作者:admin 来源:未知 点击:199

开云足球世界杯中国官网入口 讯飞首款 AI 眼镜,用 40 克撬动 AI 职责流

2026 还没过半,仍是有 30 多款 AI 眼镜亮相了。

除了华为、阿里千问、Rokid、雷鸟、小米这些老玩家,连雇主电器都推出 AI 烹调眼镜,京东方也作念了骑行眼镜……百镜皆放,但大体上在围着三件事卷:谁能作念得更轻、谁的录像头更廓清、谁的镜片上能塞进更大更好的夸耀屏。

吵杂之下,有一个数据世俗会被忽略。

目前主流电商平台上,AI 眼镜的退货率高得惊东谈主,普遍在 30% 傍边,在冲动破钞占大头的直播渠谈,退货率致使能飙到 40% 到 50%。

用户因为崭新感下单,戴了几天,肃静点了退货。销量高开低走、退货率居高不下,即是繁密 AI 眼镜的「人命周期」。

说白了,尝鲜期昔日后,破钞者就会开动产生这么的猜疑:戴上之后它到底能帮我干什么。

就在今天,科大讯飞在澳门发布了旗下首款 AI 眼镜。这副 40 克的眼镜莫得卷像素、卷全彩大屏、卷前锋联名,把中枢能力押注在一个看起来十分常见的能力上——翻译。

但翻译仅仅它的进口,不是极度。

发布会前夜,APPSO 和科大讯飞副总裁王玮、衣服建立业务部总司理林会杰聊了聊。聊到后半段,话题从具体的居品时间滚动到了一个更大的命题上:AI 眼镜下半场的谬误,到底在硬件层面如故在 AI 职责流?

AI 眼镜的「奇点」,是让东谈主赋闲一直戴

百镜大战之后,在现存供应链里攒出一款智能眼镜真不难,华强北两周就能给你出一个样机。但难的是,你怎样给用户一个「一直带领」的根由。

关于第一次作念 AI 眼镜的讯飞来说,这亦然个绕不开的坎。

王玮跟 APPSO 聊起讯飞作念 AI 眼镜的最先,其实源于一个至极具体的画面:你想啊,翻译机在展会、微型商务洽谈这些场景里是很好用的,致使公司共用一台就够。但总有一些时刻,当你在国际旅游或者某些场所,你不浅易掏出建立和折腰看屏幕,不想等翻译闭幕打断语言的自然节拍。

你但愿交流是「千里浸式」的,视力经久对着互相,对话顺畅流动,翻译像空气一样感受不到存在。这副眼镜的最先,即是用户对那种「无感」体验的期待。

这种「物理中断」,是讯飞看了大宗个翻译机用户的的确反馈后,攒下来的痛点。作念 AI 眼镜的公司不错整宿之间冒出来,但作念翻译的基础底细,确切没法速成。

讯飞翻译机卖了 100 万台、翻译了 10 亿次。讯飞同传跑了 42 万场国际会议,笼罩 50 多个国度,触达 4 亿不雅众,连气儿 8 年做事宇宙两会。

这些数字千里淀下来的不仅仅算法,还有对的确场景里那些琐碎问题的感知:什么时候用户会嫌翻译慢,什么场景下手执建立让东谈主窘态,什么杂音要求会让准确率断崖……

客岁 10 月讯飞仍是推出了一款翻译耳机。耳机考据了两件事:用户如实需要开释双手的衣服式翻译;端到端的同传在衣服建立上是跑得通的,反应速率能掐在 2 秒以内。

但耳机只管耳朵,在林会杰看来,耳机的局限在于它是一个「听觉」建立(当今也开动加录像头了),眼镜则不错增多视觉的模态,多种模态肖似在沿路,跨语言疏通的信息输入就丰富多了。

说白了,眼镜上有录像头不错拍照翻译,有夸耀不错投射字幕让你毋庸折腰看手机,还能放更多的麦克风作念定向降噪。

用王玮的话说即是,「眼镜离东谈主的眼睛、耳朵、嘴巴最近,它是物理世界与数字世界自然的桥梁,让翻译像呼吸一样自然发生。」

而到了 2026 年,供应链资本开动被拉下来了,国补也初度把智能眼镜纳了进来,再加上星火 X2 大模子云表翻译能力的进步,天时地利凑皆了。

林会杰倒挺坦率:「咱们采用这个节点,是因为看到了增速才刚刚开动。」王玮更径直:咱们不想用「iPhone 时刻」这个词,但实质上即是这个真谛,眼镜立时到了奇点邻近的时候。

40 克,一谈系统工程题

讯飞这款 AI 眼镜,我戴上之后第一反应是比联想中轻。它集成了微型夸耀屏、录像头、5+1 麦克风矩阵、喇叭,但整机重量被死死卡在了 40 克。

这个数字可能好多东谈主没宗旨,咱们来横向对比一下:

Meta Ray-Ban 是 49 克,但它莫得夸耀屏;

Rokid Glasses 亦然 49 克,带夸耀,但比讯飞重了快要 25%;

华为 AI 眼镜如实轻,35.5 克,但它莫得夸耀屏。

在「带夸耀屏」的智能眼镜阵营里,讯飞目前险些作念到了行业最轻。

为什么非得是 40 克?林会杰说,这个数字是他们用模拟仿真和海量调研死磕出来的。西洋东谈主的头型和体型对重量的钝感力相比强,Meta 作念到 50 多克他们依然认为能经受。但亚洲东谈主的颅骨结构和鼻梁高度不同,对重量相当敏锐。

关于中国用户来说,45 克是一谈分水岭,跨越这个重量,戴深刻就会有赫然的压迫感。40 克,是长时间带领的「娇傲阈值」。

为了抠掉这几克,团队在工程上跟供应链磨了很久。最谬误的一招,是用树脂镜片替代了传统的玻璃镜片。

传统近视眼镜早即是树脂的寰宇了,但为什么智能眼镜一直毋庸?因为工艺太搞心态了。智能眼镜的镜片需要作念「全贴合」,把夸耀层和镜片压在沿路。树脂材料在成型和加热时极易产生渺小的气泡,胶水一朝有一点一毫的空隙,光泽的折射曲率就偏了,所有镜片就废了,良率适度比玻璃难熬多。

林会杰显露,讯飞应该是行业里第一个在带夸耀的智能眼镜上把全贴合树脂工艺跑通的。研发流程中履历了至极多尝试和失败,才最终把树脂材料用在了夸耀镜片上,但答复是盛大的,单靠镜片这一项,就比玻璃有研讨轻了 30% 到 40%。

再加上定制的 0.15CC 微型光机、微型录像头模组,镜框镜腿一体成型。芯片选型和算法作念了深度耦合:相同的功能别家可能要 100mAh 电板,讯飞可能 50mAh 就够了。

是以临了咱们看到的讯飞 AI 眼镜,整机重量更轻,续航却没打折。

这是一谈系统工程题,莫得捷径,每一环都要跟供应链反复磨合良品率。树脂镜片、微型光机、低功耗芯片、算法 - 硬件耦合,哪一环掉链子,重量都获取到 50 克以上。

唇动识别降噪,用眼睛帮耳朵听

翻译自然是讯飞的娇傲区,但这副眼镜上,讯飞还首发了一个有点科幻的时间——唇动识别降噪,这是多模态降噪系统的中枢部分。

这是唇动识别降噪初度搭载到 AI 眼镜上,竣事逻辑是眼镜的前置录像头会死死锁定对面语言东谈主的嘴唇。同期,眼镜上的 5 颗气导麦克风和 1 颗骨传导麦克风构成了一个六通谈的音频流。

系统及时通过「看到谁的嘴在动」,来辅助判断「该听谁的声息」, 从而在嘈杂的多东谈主混声中,精确地把目的东谈主物的语音「抠」出来。

这就竣事了「看谁翻谁」的遵守,你的眼镜盯着谁,耳边响起的、镜片上跳出来的,即是谁的翻译字幕。

这个时间径直决定好多场景的翻译质料,开云世界杯官网 - 世界杯(中国)因为翻译准不准,有一个垂危的前提听得清不清。

安然的会议室里,其实目前的翻译软硬件都不错较好料理交流问题。但讯飞 AI 眼镜垂危的一个用户群是商务东谈主士,他们信得过需要用到的翻译场景是什么?是展会、商务酒会、机场,环境杂音粗率都能 80 到 90 分贝。传统翻译器具在这种环境下,准确坦荡接掉进马里亚纳海沟。

高噪场景下,唇动识别降噪让识别准确率进步了 50% 以上。林会杰讲解说,这并不是单纯看口型,它和会了声源位置增强、目的东谈主锁定等一整套多模态降噪系统,各路信号在实质使用中自动协同。

这个能力也不是拍脑袋想出来的。讯飞在大型会议系统和汽车智能座舱里,搞这种多通谈语音分离和多模态降噪仍是好多年了,在 CHiME 国际语音分离大赛上拿过 6 连冠。

王玮还给咱们共享了一个几年前的里面 Demo:几个盘问员同期讲话,东谈主耳透顶分不清,系统把每个东谈主的声息干净利落分离出来,谁说了什么都六根清净。

这事儿意旨的方位在于,以前开大会,你有有余的物理空间塞麦克风,有做事器的算力,有插座供电。当今,你要把这套复杂的视觉 - 音频和会算法,塞进一副 40 克、算力和功耗被相当压榨的眼镜里。

王玮认为,这恰正是讯飞在硬件上秀出的「肌肉」:怎样把大建立上的硬核算法作念高倍率的压缩,移植到小尺寸、轻量化的出动端侧,何况还能离线及时料理多路语音数据。

讯飞作念硬件的旅途是「大建立考据、小建立移动」。在会议系统和汽车上跑通的算法压缩到眼镜端侧。唇动识别降噪需要视觉 - 音频配对数据、端侧及时料理能力、多麦克风硬件的聚首调优,单靠现成算法集成难以竣事。

降噪的准确性径直决定翻译的准确性,这亦然整条职责流的第一谈关卡。

「万能翻译」背后的基础门径

听得清之后,才是译得准的问题。

讯飞 AI 眼镜撑执 122 种语言的及时互译,分辩了同声传译(听演讲)、靠近面翻译(商务洽谈)、通话翻译(跨国电话)和线上同传(接腾讯会议或 Zoom)等四种模式,录像头还能径直拍 PPT, 作念外文而已翻译。

在现场体验中最让我认为专诚念念的是通话翻译。

这粗略是目前市面上惟逐一款能在你打电话时,同期帮你作念跨国翻译和纪录的眼镜。它的旅途是这么的:眼镜通过蓝牙挂载在手机上,捕捉到电话那头的英语,端到端同传模子全自动翻译,再把你的中语回复翻译成英文顶且归,延长在秒级。

也即是说,你在电话这头说中语,老外皮那头听到的是你的音色克隆出来的英文。电话一挂,眼镜致使能帮你把一份结构化的会议纪要发你。

昔日,传统的翻译系统是「老三样」:语音识别(ASR)→文本翻译(MT)→语音合成(TTS)。这套有研讨最大的误差即是延长大,何况每过一个要津,信息的「语义耗费」就多一层。

讯飞此次在眼镜上搭载端到端的语音同传大模子,跳过了中间的文本转译轨范,径直竣事「语音进、语音出」,把首字反映时间压进了 2 秒。云表撑腰的是星火 X2 模子(293B 参数的 MoE 架构,基于华为昇腾历练)。

林会杰说,他们把翻译场景切分得极其幽微,因为不同场景下需要的行业常识库和降噪模式是透顶不一样的。

讯飞这款眼镜在翻译功能上花的功夫,这有点像手机行业卷影像,拍照功能谁都有,但我有 2 亿像素,有 10 倍长焦,有 4K live 图,致使能笼罩专科照相场景。

翻译之后,AI 职责流才开动

到了这一步,你会发现,讯飞想作念的仍是不仅仅「翻译器具」了。这粗略亦然为什么它不叫「翻译眼镜」,而被视「目前的超等 AI 助理」。

林会杰认为,「眼镜更像是一个戴在目前的超等计算机,带有夸耀、录像头、语音能力,它的设置跟手机、PC 基本一样。」

承载这层能力的是讯飞的 GlassClaw,这个 Agent 能调用大模子能力、接入生态做事、作念多模态剖判,把从听懂到干活的所有流程买通,同期也撑执 OpenClaw 等级三方 Agent 接入。

你没看错,这如故一副「龙虾」眼镜。

林会杰共享了他我方使用 GlassClaw 的普遍职责流:他外出毋庸世俗掏手机。在路上走着,不错径直用语音叫醒 GlassClaw,让它调取手机通信录、找客户拨号,电话接通自动开翻译。

跟客户靠近面聊天时,已而需要查阅之前的某份公约纪要,径直盲操打发眼镜,眼镜会去检索他的电脑而已,索要出重点并同步到镜片上。

致使开完会后,眼镜自行为念完多模态的扮装区分(谁说了什么),输出结构化纪要,他径直语音:「把纪要以邮件神气发给技俩组,并把下周三的复盘会同步到日期上。」

如若你也养过虾对这些功能详情不生分,只不外此次交互发生在你的脸上。

当初让 AI 眼镜出圈的提词器功能,在这款眼镜里也迎来升级。

讯飞 AI 眼镜的智能提词器功能作念到了语义随从,说到哪跟到哪,不再是机械按速率滚动,不错作念自然的智能语义剖判和随从。配套的充电胶囊不错当遥控器,按键切换和暂停文稿。

这即是 AstronClaw 架构在底层玩的「端 - 边 - 云」三级协同:眼镜端侧厚爱环境感知和预感理,旯旮侧作念决策,复杂的推理丢给云表的星火 X2。GlassClaw 基于讯飞自研的 Agent 能力,同期也撑执 OpenClaw 等级三方 Agent 接入。

王玮的判断是,畴昔的眼镜不再仅仅很简陋的一副眼镜,而是你衣服最浅易的一个随身助理。

市集上单作念翻译或单作念 AI 助手的居品不少,但把「翻译 + 纪录 + 纪要 + 跨端彭胀」串成顺滑的职责流,需要语音、翻译、大模子、智能体(Agent)四种底层能力同期在线,且为德不终紊。

讯飞这种全栈的时间能力,碰巧在眼镜这个载体上找到了合适的闭环。

AI 眼镜的下半场,拼的是什么

赛车pk10官网平台首页

昔日两年,AI 海浪裹带着所有硬件行业寻找阿谁所谓的「Next Gen」进口。

AI Pin 翻车了,各式智能吊坠无疾而终,虽然 AI 硬件的居品形态和时间阶梯互异,但行业也逐渐变成一些共鸣: AI 需要眼睛,它必须能及时感知东谈主类所处的三维物理世界。

AI 眼镜巧合不是最终形态,但它是目前惟一能够全天候、第一视角承载视觉与听觉输入的形态。

王玮在采访里提到一个挺专诚念念的预判:「畴昔的数字生涯三件套,粗略率是电脑、手机和眼镜。眼镜不是手机的配件,它我方即是一台架在鼻梁上的孤苦主机。」

眼镜自然合乎作念衔接物理世界和数字世界的建立。何况硬件本人还有很长的迭代空间:夸耀会从单色走向全彩、从 2K 走向 4K;录像头和麦克风还会向 AI 原生的 token 编码时势升级。王玮说这些时间旅途仍是开动有相比默契的发展宗旨了。

林会杰显露,讯飞的第二代 AI 眼镜仍是在研讨中,最快 2026 年秋季能看到,面向更多不同东谈主群,也在摸索一些细分的垂直场景。

昔日一年 APPSO 测过、写过不少 AI 眼镜。回头看百镜大战,行业其实仍是分化出了两条不同的路:

一条是「作念最佳的眼镜,让 AI 成为加分项」。 Meta Ray-Ban 是这个逻辑:用前锋遐想和品牌文化来对冲用户对 AI 能力的低频刚需。

另一条是「作念更深的 AI 职责流,让眼镜成为新的电脑」。 讯飞采用的即是这条路。两条路指向不同的竞争维度,但后一条更难走,因为它要求你同期具备硬件工程能力和 AI 全栈能力,统筹兼顾。

AI 眼镜的下半场,信得过的分水岭在于,谁能把 AI 揉进高度细分的的确场景里,替用户把一件件琐碎任务给办了。

让眼镜回来眼镜, AI 老缓助实当「牛马」。

临了能留住来的建立,我想粗略是这么的:当你摘下它的时候开云足球世界杯中国官网入口,会已而认为目前的世界变得千里重而低效。

相关标签: