第228章 零键行动(2 / 3)

加入书签

。”

其实基本的输入法,语音识别,都有成熟的‘轮子’了,主要是结合AI的语音个性化声纹识别这块,需要做到每个人都拥有一个独特的声纹识别库、声纹识别AI模型,这是毕竟有难度。

然后再把这些整合为一个整体,而且各个识别模型,不能互串,才是最后的攻坚高地。

接下来张伟和‘突击队’进入了闭关状态!

两周后。

“零键行动”团队首次产品、技术评审会。

小杨站在前面详细地解释产品实现思路:“第一步,每位用户首次登录、使用本输入法时,会朗读10句训练文本,我们会用AI为每个人建立一个‘语音特征声纹’AI识别模型。”

“第二步,我们根据这个声纹,记录下常见的错误发音,比如h和f不分,平舌卷舌不清楚等等,用AI进行语音纠错建模。”

“第三步,基于第一,第二步的识别、判断、筛选,在针对性推送这种语音习惯下的,易说错文字,易说错词语,易说错句子,最终实现给这个用户私人定制出,一套独一无二的专属AI语音识别输入法。”

“第四步,系统再结合Gpt类的语义推理引擎,进行实时语音预测,根据用户习惯进行候选词排序,从而达到个性化精准识别。”

大家最初还带着怀疑,这可太吊炸天了啊,这下VR输入法,完全被彻底的解决了啊。

想想pc端的输入法“搜狗”被鹅厂收购时,可是35亿美金,248亿人民币啊。

可是那只是一个键盘输入法,完全是基于输入习惯+联想模式的产品逻辑,算是一款大众化的通用产品。

和张伟现在借助AI、大模型的玩法不可同日而语。

张伟这个完全是站在真正的AI这个巨人肩上,打造的语音输入法,二者从产品构建逻辑上看,完全是两种产品。

就像一个动力是马匹,张伟的动力是内燃机。

张伟这个‘xR语音输入法’最大的劣势,用户太少了,数据量太小了。

和搜狗输入法,在用户,数据量这个维度完全不可比啊。

不过现在VR的用户很少,张伟的用户更少。

正因为少,也正因为刚起步,所以张伟反而抢占了,xR输入法的先发优势,哈哈。

张伟也是被逼的哦,自己的产品要使用输入法,奈何系统厂商不给力啊。

就像搜狗当年,微软Abc输入法不给力,才造就了搜狗248亿的市场机会。

小杨一脸的洋洋得意,说完,就开始展示demo。

一位广西籍的员工迫不及待戴上头显,完成了前期声纹的识别动作后。

兴奋地大喊:“广西壮族自治区!”

语音输入法精准识别:“广西壮族自治区’。”

“卧槽!啊!啊!哈哈!”广西籍员工兴奋地跳了起来,“终于不是‘广西撞死四只鸡’了!哈哈!”

全场瞬间沸腾,瞬间笑喷了。

大家纷纷用自己那不标准的普通话,拿来调戏刚出生的xR声纹输入法。

一旁的交付小哥激动地喊道:“哈哈,我们做的哪是输入法啊,我们简直是在给每个人私人定制一个AI同传啊!”

这点,交付小哥太有发言权了,他就是经常接触客户的,这个点估计被吐槽了很多次吧。

只是以前都是用“这是系统自带的输入法,咱们也没办法啊,得找quest老板扎克伯格修改才行!”

直接甩锅给,大美利坚了!

人群中,立马有人回复:“必须的,这话说的太对了,只要能精准的转换成文字,基于Gpt的能力,可以全球语言完全实时同声传译了啊。哈哈!”

张伟大手一挥:“战友们,干的漂亮,今晚吃大餐,哈哈!”

....

晚上张伟复盘了这次的操盘,觉得很有价值,得沉淀成自己的cEo底蕴。

张伟进行了总结,这种打法,从兵法的角度,就是集中优势兵力做单点突破。

<

↑返回顶部↑

书页/目录