本文主要介紹airpods的語(yǔ)音喚醒siri(ai rpods語(yǔ)音功能)實(shí)用性如何?,下面一起看看airpods的語(yǔ)音喚醒siri(ai rpods語(yǔ)音功能)實(shí)用性如何?相關(guān)資訊。
據(jù)行業(yè)分析師預(yù)測(cè),2019年蘋果airpods出貨量將超過(guò)5000億臺(tái),2021年有望突破1億臺(tái)!這款從發(fā)布到成功引領(lǐng)市場(chǎng)都被嘲諷的產(chǎn)品,早就是追趕和超越的對(duì)象。耳機(jī)行業(yè)近幾十年沒有發(fā)生大的變化,tws耳機(jī)的出現(xiàn)會(huì)讓整個(gè)市場(chǎng)在未來(lái)有數(shù)百億美元的增長(zhǎng)空間。
airpods已經(jīng)成為蘋果 增長(zhǎng)最快的配件產(chǎn)品。在手機(jī)銷量整體下滑的情況下,每個(gè)手機(jī)廠商都在尋找自己的突破口,如何重新奪回市場(chǎng)先機(jī)成為了尤為重要的關(guān)鍵。
tws耳機(jī)airpods不僅重振了音頻市場(chǎng),也成為了蘋果這樣的手機(jī)制造商的救命稻草。airpods推出的語(yǔ)音交互、聲紋識(shí)別和支付、esim的獨(dú)立使用成為tws耳機(jī)的下一個(gè)戰(zhàn)場(chǎng)。
tws耳機(jī)被稱為2019年消費(fèi)電子市場(chǎng)的最大亮點(diǎn)。智能語(yǔ)音識(shí)別的加入將繼續(xù)擴(kuò)大tws耳機(jī)市場(chǎng)蛋糕,吸引五大玩家:
運(yùn)營(yíng)商進(jìn)入市場(chǎng):聯(lián)通和移動(dòng),使得獨(dú)立使用耳機(jī)產(chǎn)品成為可能;
互聯(lián)網(wǎng)巨頭搶占入口:亞馬遜、谷歌、微軟、百度;
電商和支付加盟:、支付寶、骨聲紋識(shí)別、安全支付,以及手機(jī)支付向骨聲紋支付的轉(zhuǎn)變。
手機(jī)廠商繼續(xù)加碼:蘋果、華為、小米、三星、索尼、oppo、榮耀、一加、魅族,都推出了自己的耳機(jī)產(chǎn)品。
內(nèi)容平臺(tái)緊隨其后:音樂(lè)、網(wǎng)易音樂(lè)、喜馬拉雅fm,為tws耳機(jī)提供持續(xù)的生命力。
市場(chǎng)已經(jīng)很久沒有這么熱鬧了,仿佛回到了智能手機(jī)爆發(fā)初期的繁華階段,然后八仙漂洋過(guò)海,各取所需,各顯神通。
在上一輪的智能音箱爭(zhēng)奪戰(zhàn)中,我們看到了以蘋果、谷歌、亞馬遜、百度、阿里、騰訊、小米等為代表的先頭部隊(duì)。在這些巨頭的參與下,中小企業(yè)只能選擇站隊(duì),投靠自己的陣營(yíng),獲取內(nèi)容、流量、補(bǔ)貼等資源。
通過(guò)我愛音頻網(wǎng)的分析,智能耳機(jī)的風(fēng)口會(huì)比音箱更加兇猛,觸手可及。今天,讓我們 下面我們來(lái)討論一下如何搶占智能耳機(jī)的風(fēng)口。
第一,tws耳機(jī)發(fā)展迅速,蘋果憑借airpods引領(lǐng)市場(chǎng)。
idc近日發(fā)布了2019年第一季度全球智能手機(jī)市場(chǎng)研究報(bào)告。數(shù)據(jù)顯示,全球智能手機(jī)出貨量為3.108億部,同比下降6.6%。其中,全球出貨量前六的廠商大多也處于同比下滑的狀態(tài),蘋果甚至下降了30%以上。
與手機(jī)市場(chǎng)的冷淡相比,tws藍(lán)牙耳機(jī)正以不可思議的速度發(fā)展。根據(jù)counterpoint 的數(shù)據(jù),在22018年第四季度,airpods 出貨量占市場(chǎng)的60%,達(dá)到1250萬(wàn)臺(tái)。
根據(jù)上述avalon,最近三年假日airpods在谷歌上的搜索興趣峰值為100(代表最大搜索興趣)。2016年峰值10,2017年20,2018年100,同比增長(zhǎng)500%。這個(gè)增長(zhǎng)速度真的很驚人。
由此可見,tws耳機(jī)的市場(chǎng)容量是巨大的,音響和手機(jī)廠商也加入了這一領(lǐng)域,勢(shì)必會(huì)從這塊巨大的蛋糕上切下一塊。
2019年3月20日,蘋果推出了一款全新的tws真無(wú)線藍(lán)牙耳機(jī)——ai rpods 2。這次升級(jí),主控芯片換成了全新的h1,而且除了支持無(wú)線充電,還有一個(gè)很重要的點(diǎn),就是語(yǔ)音喚醒。
二、tws耳機(jī)語(yǔ)音喚醒方案的實(shí)現(xiàn)細(xì)節(jié)。
airpods的成功源于其高品質(zhì)的體驗(yàn),第二代airpods升級(jí)了語(yǔ)音喚醒,這是智能語(yǔ)音中非常重要的一部分。手機(jī)上已經(jīng)有很多支持了,比如iphone的hey siri,小米9的蕭艾,三星galaxy s10的hi bixby等等
耳機(jī)方面,大量耳機(jī)仍然使用觸摸或按鍵喚醒來(lái)激活語(yǔ)音助手。物理觸摸或點(diǎn)擊與語(yǔ)音激活之間的差距當(dāng)然不言而喻。
蘋果率先支持語(yǔ)音喚醒,那么其他廠商能否跟上,如何實(shí)現(xiàn)?需要考慮哪些技術(shù)細(xì)節(jié)?
首先,tws耳機(jī)本地喚醒詞的應(yīng)用由語(yǔ)音識(shí)別和假喚醒處理兩部分組成:
1.喚醒詞的語(yǔ)音識(shí)別(本地語(yǔ)音命令也是如此)
喚醒詞識(shí)別需要增加用戶和用戶之間的信噪比;;s語(yǔ)音和背景音進(jìn)行前端信號(hào)處理,從而在不同的應(yīng)用場(chǎng)景下獲得最高的喚醒率。我們列出了從麥克風(fēng)收集用戶的時(shí)間 s語(yǔ)音信息數(shù)據(jù)到喚醒詞識(shí)別結(jié)束。
按順序完成喚醒詞識(shí)別所需的算法安排如下:
mic→(lpsd或vad)→(bf)→(ns或nr)→(kwd)
算法名稱和參考供應(yīng)商
lpsd或vad,lpsd(低功率聲音檢測(cè)),vad(語(yǔ)音主動(dòng)檢測(cè)),參考供應(yīng)商dspc,賽耐瑞;;
bf,bf(波束形成)參考供應(yīng)商dspc;;
ns或nr,ns(噪聲抑制、降噪)參考供應(yīng)商dspc;;
關(guān)鍵詞檢測(cè)參考供應(yīng)商sensory,aispeech,nuance,cyberon。
目前真正能夠提供足夠計(jì)算能力,將上述算法集成在單個(gè)藍(lán)牙芯片上,實(shí)現(xiàn)低功耗本地喚醒詞功能的有高通:qcc512x和qcc302x。
芯片產(chǎn)品如、瑞宇、恒軒建議搭配quicklogic、ambiq apollo2、apollo3或lou s ia610和ia611智能麥克風(fēng)芯片,滿足高計(jì)算能力和低功耗要求下的本地喚醒詞功能。
所有的算法或芯片都必須以合法的獲得使用權(quán)和各種必要的技術(shù)支持。這些供應(yīng)商中quicklogic的eos s3是第一個(gè)與宇恒互動(dòng)ovvp算法完全集成并應(yīng)用于實(shí)際客戶產(chǎn)品的。s3芯片還有891可編程邏輯單元,設(shè)計(jì)非常獨(dú)特,可以滿足特殊硬件接口的需要。
2、喚醒詞或語(yǔ)音命令誤喚醒,誤觸發(fā)處理。
錯(cuò)誤喚醒或錯(cuò)誤觸發(fā)的定義:
對(duì)于tws耳機(jī)用戶,非用戶本人說(shuō)出喚醒詞或語(yǔ)音指令后,語(yǔ)音助手無(wú)響應(yīng)或語(yǔ)音指令不動(dòng)作,但他說(shuō)出喚醒詞后,可以喚醒或運(yùn)行耳機(jī)用戶的語(yǔ)音助手或語(yǔ)音指令。
市場(chǎng)上幾種不同方案的描述:
21、基本處理
一般在喚醒詞算法組中,bf可以降低誤喚醒率,但與聲源方向有關(guān)。在兩個(gè)麥克風(fēng)距離足夠遠(yuǎn),產(chǎn)品結(jié)構(gòu)聲學(xué)架構(gòu)調(diào)試得當(dāng)?shù)那闆r下,dspc的bf算法可以做到3 db到6 db。
這部分細(xì)節(jié)可以咨詢dspc代理商,他們有專業(yè)的聲學(xué)專家和實(shí)驗(yàn)室,為有需求的tws耳機(jī)廠商提供充足的聲學(xué)相關(guān)設(shè)計(jì)服務(wù)。
22,使用vpu骨傳導(dǎo)傳感器
參考華為huaw測(cè)試難度。
加入高頻負(fù)反饋放大器后,低頻被上拉增加動(dòng)態(tài)范圍,同時(shí)人體運(yùn)動(dòng)的低頻信號(hào)又被上拉。vpu的自然高通濾波效果更差,后期加入高通濾波算法,濾除人體運(yùn)動(dòng)引起的傳感器機(jī)械瞬態(tài)變化產(chǎn)生的多次諧波干擾。此外,通話和音樂(lè)應(yīng)用場(chǎng)景下的揚(yáng)聲器振動(dòng)串?dāng)_問(wèn)題也需要解決。
所以從我愛音頻網(wǎng)拆解的華為huawei freebuds2 pro板確認(rèn),確實(shí)有運(yùn)算放大器,并且增加了一個(gè)da14195來(lái)應(yīng)對(duì)各種算法和a/d接口。使用喚醒字時(shí),該產(chǎn)品的靈敏度約為76db(在ovvp靈敏度規(guī)格范圍內(nèi))。
喚醒字的誤喚醒處理可以達(dá)到19 db到22 db(在ovvp ■強(qiáng)音隔離盾)。使用加速度骨傳導(dǎo)傳感器感知聲帶振動(dòng)和僅使用麥克風(fēng)感知用戶語(yǔ)音的區(qū)別在于,在說(shuō)喚醒詞或語(yǔ)音指令時(shí),語(yǔ)音音量肯定更高(相差7db左右),這個(gè)廠商設(shè)計(jì)的產(chǎn)品還是很有代表性的。
此外,這款產(chǎn)品還有幾個(gè)本地語(yǔ)音指令,科技感十足,充分發(fā)揮了vpu的優(yōu)勢(shì)。不像蘋果,用戶說(shuō)話聲音要大一點(diǎn),但是假喚醒處理比apple s,而且對(duì)音源方向沒有限制。任何方向都可以。
然而,vpu是用來(lái)感知用戶的 的語(yǔ)音并協(xié)助完成安全性要求較高的支付功能。不知道清音語(yǔ)音頻譜的結(jié)構(gòu)缺陷是否嚴(yán)重影響用戶體驗(yàn)?
使用骨傳導(dǎo)傳感器會(huì)使recode聽碼和strange聽碼沒有清音補(bǔ)償。變,華為是阿偉,河是鵝,傅是虛無(wú),錢是文字。
聲學(xué)結(jié)構(gòu)的改變會(huì)造成人工智能語(yǔ)音識(shí)別的嚴(yán)重錯(cuò)誤。知乎看到很多對(duì)此的投訴,用戶故意大聲說(shuō)無(wú)法完成支付或聲紋學(xué)習(xí)??磥?lái)這個(gè)問(wèn)題沒有解決好,也有可能是freebuds2 pro中處理不好或者某種壞字識(shí)別引擎導(dǎo)致的。
從產(chǎn)業(yè)角度來(lái)看,華為領(lǐng)先蘋果幾個(gè)多月開了個(gè)好頭,讓智能tws耳機(jī)的步伐加快了幾步。幾十年來(lái)除了關(guān)注耳機(jī)產(chǎn)品的音質(zhì)和噪音水平,還注入了智能語(yǔ)音應(yīng)用的亮點(diǎn)和活水,教育了大眾,激活了行業(yè),讓行業(yè)再次擴(kuò)張,引發(fā)新的浪潮成為可能。
23.使用mems加速度計(jì)的骨傳導(dǎo)傳感器(上行鏈路降噪)
蘋果airpods,使用多重手段(lpsd、bf、骨傳導(dǎo)降噪),條件下 不改變用戶 s習(xí)慣 ,喚醒詞誤喚醒的效果在7db~9db左右(用戶身后0.5 m的環(huán)境噪聲相對(duì)于只做bf和ns的喚醒詞開發(fā)板是45db)。
airpods支持喚醒詞(本地、云端或本地手機(jī)),所有語(yǔ)音命令都在云端。在云端,優(yōu)點(diǎn)是文字無(wú)限靈活,識(shí)別準(zhǔn)確率更高,抗噪能力更強(qiáng),本地芯片占用資源更少,缺點(diǎn)是網(wǎng)絡(luò)質(zhì)量差時(shí)使用體驗(yàn)迅速惡化甚至無(wú)法使用,響應(yīng)速度慢。
除了壓電材料的vpu(模擬輸出)之外,目前市場(chǎng)上唯一采用mems技術(shù)的st意法半導(dǎo)體的lis25ba(tdm接口)產(chǎn)品。lis25ba是一款全數(shù)字產(chǎn)品,具有a/d和tdm接口。相關(guān)信息可從st意法半導(dǎo)體獲取。
雖然市場(chǎng)上有傳感器可用,但由于蘋果 具有強(qiáng)大而嚴(yán)密的維權(quán)覆蓋面的美國(guó)專利,以及承擔(dān)改變上行聲音數(shù)據(jù)聲學(xué)結(jié)構(gòu)所帶來(lái)的風(fēng)險(xiǎn)的技術(shù)難度,目前市場(chǎng)上沒有專門的降噪算法可以流通,dspc、傳感器、高通等知名算法也沒有明顯的動(dòng)靜,但國(guó)內(nèi)一些m《國(guó)防科學(xué)技術(shù)大學(xué)研究生院工程碩士學(xué)位論文:面向骨傳導(dǎo)語(yǔ)音消噪算法及硬件實(shí)現(xiàn)技術(shù)研究》
這是一篇基于非負(fù)稀疏編碼nnsc(nonnegative sparse coding,非負(fù)稀疏編碼)是去噪的核心,采用一種采用amdf(average magnitude difference function,平均幅度差函數(shù))技術(shù)的vad算法來(lái)消除風(fēng)噪、槍聲和摩擦噪聲。
這不是蘋果用的降噪技術(shù),但是可以讓你初步了解骨傳導(dǎo)降噪或者vad。本文通過(guò)測(cè)量人的可懂度,以骨傳導(dǎo)傳感器感知的聲帶振動(dòng)作為主要聲源,以一個(gè)傳統(tǒng)的麥克風(fēng)作為噪聲源,通過(guò)算法完成降噪。
但是現(xiàn)在可懂度不僅僅是由人來(lái)衡量,也由機(jī)器(語(yǔ)音識(shí)別算法)來(lái)衡量,而機(jī)器對(duì)可懂度的要求要比人高得多,因?yàn)闄C(jī)器對(duì)于語(yǔ)音識(shí)別的整體智能遠(yuǎn)不如人。
這里編制了一個(gè)對(duì)照表。拿蘋果 s tws耳機(jī)作為參考標(biāo)準(zhǔn),比較如果兩個(gè)完全不同的聲學(xué)傳感器感知的聲音信息數(shù)據(jù)等于一個(gè)聲學(xué)傳感器在降噪后感知的聲音信息數(shù)據(jù),會(huì)面臨多少問(wèn)題和挑戰(zhàn)。
根據(jù)上表,以下問(wèn)題以敘述排列:
1)雙麥上行降噪算法技術(shù)的終極目標(biāo):只留下用戶的語(yǔ)音,最大程度的消除或抑制,非用戶。
我所有的聲音都是通過(guò)聲帶運(yùn)動(dòng)發(fā)出的,但是我必須用傳統(tǒng)的麥克風(fēng)發(fā)出降噪的上行聲音信息數(shù)據(jù)。
用戶的數(shù)據(jù) 風(fēng)拾取的原始語(yǔ)音信息完全相等。
2)算法中使用了加速度骨傳導(dǎo)傳感,改變了以往空氣介質(zhì)傳導(dǎo)聲能,推動(dòng)某種物質(zhì)的方法。
膜轉(zhuǎn)化為電能,變成軟骨、肌肉、皮膚介質(zhì)傳導(dǎo)聲音,但算法還是用兩種空氣介質(zhì)傳導(dǎo)聲音。
麥克風(fēng)用來(lái)彌補(bǔ)加速度骨傳導(dǎo)傳感器的不足。;t感清音,氣導(dǎo)穩(wěn)定性高,變量少,體驗(yàn)多。
1998年的時(shí)候已經(jīng)很好理解了,但是聲音通過(guò)軟骨、肌肉、皮膚介質(zhì)的傳播,和很多不穩(wěn)定的變量有關(guān)。
應(yīng)用還在積累過(guò)程中,蘋果是世界上應(yīng)用經(jīng)驗(yàn)最多的。
3)下面我們列出了算法需要完成的幾個(gè)方程:
1.加速度骨傳導(dǎo)傳感器雙麥克風(fēng)=雙麥克風(fēng)
2,(軟骨、肌肉、皮膚、汗液、油污、灰塵媒介傳遞變量)空氣溫度和濕度媒介傳遞變量=空氣溫度和濕度
程度中等轉(zhuǎn)移變量
3,單音(濁音清音)=濁音清音。
4.產(chǎn)品結(jié)構(gòu)和耳廓結(jié)構(gòu)嚴(yán)重影響產(chǎn)品結(jié)構(gòu)影響=產(chǎn)品結(jié)構(gòu)影響。
5、人體運(yùn)動(dòng)嚴(yán)重影響人體運(yùn)動(dòng)不影響=人體運(yùn)動(dòng)不影響。
6、人工算法融合拼接補(bǔ)償兩種不同的材料,不同的導(dǎo)電介質(zhì)結(jié)構(gòu),不同的響應(yīng)相位延遲,低頻調(diào)制。
系統(tǒng)=裝配在一起。
4)對(duì)于麥克風(fēng)的上行信息數(shù)據(jù),這些信息數(shù)據(jù)用于、存儲(chǔ)和傳輸信息,是工具。進(jìn)一步應(yīng)用的聲音信息數(shù)據(jù)范圍很廣,需要滿足市場(chǎng)上成千上萬(wàn)種聲音應(yīng)用軟件和硬件的需求。
項(xiàng)目決策者必須謹(jǐn)慎,在規(guī)劃項(xiàng)目時(shí)做出兩步?jīng)Q策,然后系統(tǒng)地觀察謹(jǐn)慎的測(cè)試。
蘋果公司在2012年之前就開始研發(fā),并于2012年9月28日提交了第13/631,716號(hào)專利,專利號(hào)為。wo 2014/051969 a1,2014年4月3日。airpods于2016年9月8日上市,第二代airpods于2019年3月20日上市。
這么大的龍頭企業(yè)積累了八年的基地,所以don 不要低估這項(xiàng)技術(shù)。而且國(guó)內(nèi)市場(chǎng)這些可能的算法供應(yīng)商也不可能有蘋果這么長(zhǎng)時(shí)間的積累。能否實(shí)現(xiàn)彎道超車還有待觀察。
由此可以合理推測(cè),蘋果 w1或h1芯片中的s上行降噪技術(shù)可能是使用計(jì)算能力最多的一個(gè)程序,h1芯片估計(jì)會(huì)為未來(lái)的下行環(huán)境降噪預(yù)留一些計(jì)算能力資源。
目前市面上的tws耳機(jī)藍(lán)牙芯片產(chǎn)品,在低功耗的要求下,需要滿足這種算法的運(yùn)算能力要求,而高通 s最高階qcc512x在二次功耗的限制下,需要不斷的努力才能實(shí)現(xiàn)。
5)加速度骨傳導(dǎo)傳感器增加了機(jī)械瞬態(tài)變化和環(huán)境應(yīng)力老化的各種物理特性。許多聲學(xué)應(yīng)用需要通過(guò)使用信息技術(shù)和算法模型來(lái)更系統(tǒng)地探索。其中,補(bǔ)償清音和拼接融合兩個(gè)不同傳感器感知的聲音信息數(shù)據(jù)所引起的聲學(xué)諧波的結(jié)構(gòu)變化,極大地影響了現(xiàn)有云語(yǔ)音語(yǔ)義識(shí)別算法的可懂度。需要仔細(xì)評(píng)估測(cè)試。人耳不易聽到的變化對(duì)語(yǔ)音識(shí)別算法來(lái)說(shuō)可能是致命的。
airpods 1上市的這幾年,dspc、s測(cè)試接頭的研發(fā)和生產(chǎn)需要很長(zhǎng)時(shí)間。你可以把a(bǔ)irpods從ifixit上拆下來(lái),用大量的粘合劑固定??梢姡瑸榱藵M足測(cè)試并保持性能指標(biāo),其裝配工藝難度極大。在相關(guān)技術(shù)確定成熟的情況下,從外觀策劃到出貨,估計(jì)需要一年時(shí)間,雖然快,但或許還不夠。
24.使用st lis2dw12(spi接口)的加速度計(jì)傳感器的ovvp算法(骨聲紋用戶語(yǔ)音識(shí)別)。
傳感器選擇:ovvp算法對(duì)傳感器內(nèi)部的噪聲密度、分辨率、帶寬、odr、高低通濾波器都有一定的限制和要求,需要指定目前性價(jià)比最高的匹配。高st lis2dw12傳感器。
ovvp算法與手機(jī)聲紋識(shí)別的對(duì)比表明,:
這是我們客戶提到的一個(gè)有代表性的問(wèn)題。使用ovvp算法看起來(lái)類似于在手機(jī)上使用聲紋識(shí)別。何必呢?讓 讓我們做個(gè)比較:
1)聲紋識(shí)別需要對(duì)特定單詞進(jìn)行學(xué)習(xí)和訓(xùn)練,而ovvp不需要;
2)聲紋識(shí)別只能局部保護(hù)用戶訓(xùn)練的單詞,ovvp全局保護(hù)每個(gè)單詞。
3)聲紋識(shí)別的安全級(jí)別遠(yuǎn)高于ovvp;
4)聲紋識(shí)別容易受到用戶的影響。;的環(huán)境,情緒和聲音嘶啞,但ovvp不會(huì);
5)聲紋識(shí)別只能對(duì)用戶訓(xùn)練過(guò)的單詞產(chǎn)生強(qiáng)語(yǔ)音隔離效果,而ovvp可以對(duì)每個(gè)單詞進(jìn)行強(qiáng)隔離;
6)ovvp算法使用用戶 現(xiàn)有的加速度傳感器,不需要額外的硬件成本,如聲紋識(shí)別;
7)ovvp算法可以和雙擊、計(jì)步、心率等算法共存,聲紋識(shí)別與之無(wú)關(guān);
8)聲紋識(shí)別沒有伴音標(biāo)記,ovvp的伴音標(biāo)記可以用于兩個(gè)開發(fā)和擴(kuò)展應(yīng)用;
利用伴侶音標(biāo)與手機(jī)語(yǔ)音應(yīng)用app的強(qiáng)連接,提升用戶體驗(yàn);
伴隨音標(biāo)是用戶說(shuō)話時(shí)加速度傳感器感應(yīng)到的聲帶運(yùn)動(dòng)。在經(jīng)過(guò)ovvp算法處理之后,由用戶所說(shuō)的話產(chǎn)生的信息數(shù)據(jù)的特征在于,該信息僅在用戶戴著耳機(jī) 說(shuō)話 。當(dāng)戴耳機(jī)的用戶旁邊的人的聲音低于強(qiáng)語(yǔ)音隔離屏蔽時(shí),就無(wú)法生成這個(gè)信息數(shù)據(jù)。我們的客戶 s的產(chǎn)品有很強(qiáng)的語(yǔ)音隔離屏蔽,可以達(dá)到50 cm,100 db。
伴音符號(hào)的用法:
伴隨的聲音標(biāo)記(如下)將與麥克風(fēng)聲音數(shù)據(jù)一起通過(guò)藍(lán)牙傳輸?shù)绞謾C(jī)。通過(guò)兩者的同步,我們可以知道用戶什么時(shí)候說(shuō)話,說(shuō)了什么。
翻譯軟件很多人都用過(guò),尤其是google translate,相當(dāng)好用。選擇好翻譯的語(yǔ)言后,翻譯軟件在說(shuō)話前要先按下屏幕上的麥克風(fēng)按鈕,然后說(shuō)一句話,然后停下來(lái)等它被翻譯成另一種語(yǔ)言,再?gòu)氖謾C(jī)揚(yáng)聲器里播出來(lái)。屏幕上這個(gè)按下的麥克風(fēng)按鈕可以由一個(gè)伴隨標(biāo)記代替。
是不是只要用戶說(shuō)話就自動(dòng)按下屏幕上的麥克風(fēng)按鈕,然后翻譯成另一種語(yǔ)言通過(guò)揚(yáng)聲器播放,而不需要按麥克風(fēng)按鈕,更自然方便?
用戶 的聲音伴隨著聲音標(biāo)記可以使語(yǔ)音識(shí)別算法,除了拿起用戶 s自己的語(yǔ)音在近場(chǎng),快速得到語(yǔ)音的起點(diǎn)和終點(diǎn),可以有效優(yōu)化語(yǔ)音識(shí)別算法的應(yīng)用體驗(yàn)。
除了翻譯軟件,還有很多這樣的語(yǔ)音應(yīng)用,比如語(yǔ)音短信、錄音機(jī)、語(yǔ)音輸入法、語(yǔ)音助手、語(yǔ)言學(xué)習(xí)、手機(jī)駕駛模式、語(yǔ)音轉(zhuǎn)文字...等等。
而伴隨聲標(biāo)而存在的強(qiáng)隔音屏障,使用戶在多人高密度、嘈雜的環(huán)境中,也能得到相互影響最小的效果,語(yǔ)音識(shí)別算法也不需要考慮遠(yuǎn)場(chǎng)拾音問(wèn)題。當(dāng)然,如果能有骨傳導(dǎo)降低噪音的能力,那肯定是一件美好的事情,那就完美了。
附隨音標(biāo)可通過(guò)藍(lán)牙發(fā)送到手機(jī),可用于語(yǔ)音助手、自動(dòng)錄音、自動(dòng)翻譯、語(yǔ)音信息自動(dòng)發(fā)送、語(yǔ)音輸入法、駕駛模式、游戲等各種語(yǔ)音相關(guān)應(yīng)用。
ovvp應(yīng)用的相關(guān)技術(shù):
ovvp(own voic:。
31.(深圳)知識(shí)產(chǎn)權(quán)保護(hù)中心成立于2018年12月25日。
32.廣州互聯(lián)網(wǎng)法院于2018年7月28日在琶洲世貿(mào)中心成立。
33.2018年9月9日,北京互聯(lián)網(wǎng)法院成立。
第四,專利侵權(quán)的分析
1.蘋果專門從事李:六月。18960.686686866617
利用專利摘要、專利說(shuō)明書和個(gè)人音頻設(shè)備專有權(quán)中的技術(shù)特征,專利使用了一個(gè)模糊的詞,骨傳導(dǎo)拾音換能器,說(shuō)明書的最后還提到了加速度計(jì)[0005]。這項(xiàng)專利適用于tws耳機(jī)制造商。只要在專利的20項(xiàng)權(quán)利要求中有一項(xiàng)使用了骨傳導(dǎo)拾音換能器(包括m:。
直接從市場(chǎng)取證,鑒定,打官司,交保證金,封倉(cāng)。
華為、vivo、oppo、聯(lián)想、小米等知名品牌廠商與蘋果的重合度較大,蘋果更重視。
關(guān)于華強(qiáng)北。;美國(guó)市場(chǎng),因?yàn)榭蛻羧号c蘋果不重疊,投訴主體太小,可以幫助蘋果培養(yǎng)未來(lái)的潛在客戶。
這個(gè)專利非常嚴(yán)格,需要市場(chǎng)上的同行。小心避開。
2.華為專利201811199154.2
通過(guò)分析本專利的摘要和方法專有權(quán)14和權(quán)利要求15中的技術(shù)特征,華為 的專利可謂孤注一擲。前者的系統(tǒng)專有權(quán)1和權(quán)利要求213基本容易隱藏且多屬于芯片內(nèi)的處理或算法軟件,不易取證,而方法專有權(quán)14和權(quán)利要求15同樣嚴(yán)格,容易涉及侵權(quán)。
重點(diǎn)是利用骨骼振動(dòng)傳感器控制拾音設(shè)備開始拾音。這一聲明符合tws耳機(jī)行業(yè)的關(guān)鍵低功耗要求。華為提到了sonion 專利說(shuō)明書第[0047]條中的骨傳導(dǎo)傳感器,即vpu。
因此,華為 美國(guó)專利侵權(quán)很容易判斷。首先要確定是否有vpu,然后通過(guò)測(cè)量通過(guò)物理耳機(jī)的電流來(lái)確認(rèn),對(duì)比說(shuō)話前后的電流差和麥克風(fēng)的拾音時(shí)機(jī)。
所以用vpu做vad降低功耗的方案很難實(shí)現(xiàn)。另外,本專利的權(quán)利要求2至13都是算法或功能軟件,華為會(huì)將這些算法或功能軟件逐一拆解成權(quán)利要求,這也便于他日后利用專利維權(quán)攻擊對(duì)手。
3.宇恒公司專利200910190129.2
專利摘要和兩項(xiàng)專有權(quán)內(nèi)的技術(shù)特征用于分析。加速度傳感器用于感應(yīng)聲帶、雙擊或計(jì)步。經(jīng)算法計(jì)算后,發(fā)現(xiàn)(判斷和比較)是否落在預(yù)設(shè)的閾值范圍內(nèi),判斷結(jié)果為 什么時(shí)候說(shuō)話?這有助于決定是否應(yīng)該通過(guò)藍(lán)牙將語(yǔ)音助理鍵碼或判斷結(jié)果(命令字)發(fā)送到移動(dòng)。
只要用戶的vad和;s聲帶運(yùn)動(dòng)是根據(jù)加速度傳感器獲得的作為a 參考是否發(fā)送語(yǔ)音助手鍵碼或何時(shí)說(shuō)話 ,無(wú)論其是否具有上行降噪功能,均視為侵權(quán)。這個(gè)專利的申請(qǐng)時(shí)間落在2009年,是一個(gè)可攻可守的專利。
宇恒公司專利201010224769.3,201010224780。x,201010224803.7,201010230464.3,
201010243048.7和201120374763.4,包括加速度、陀螺儀、磁力計(jì)、氣壓計(jì)感知聲音的應(yīng)用,都在2010 ~2011年下降,可以在傳感器vad的應(yīng)用中起到極好的防御作用。
有興趣做骨傳導(dǎo)上行降噪算法的團(tuán)隊(duì)或公司,宇恒互動(dòng)有興趣提供專利,共同研究如何利用這些專利組合,至少可以突破蘋果在的專利封鎖,增加談判籌碼,降低自己和未來(lái)客戶的風(fēng)險(xiǎn)。
宇恒公司專利201810437831.3使用專利摘要和兩項(xiàng)專利分析權(quán)利要求16中的技術(shù)特征,使用一個(gè)或兩個(gè)單軸或多軸、模擬或數(shù)字加速度傳感器感知聲帶振動(dòng)和/或人體面部皮膚、肌肉和肢體運(yùn)動(dòng),并產(chǎn)生傳感器vad的控制信號(hào),無(wú)論是否使用m測(cè)試復(fù)用音的結(jié)構(gòu)。
國(guó)內(nèi)外知名人工智能語(yǔ)音應(yīng)用巨頭,在了解ovvp算法的過(guò)程中,非常注重專利描述。顯然,這個(gè)問(wèn)題對(duì)這類企業(yè)影響很大。
摘要
隨著旗艦手機(jī)逐漸取消3.5mm接口實(shí)現(xiàn)輕薄化趨勢(shì),續(xù)航、傳輸、音質(zhì)、價(jià)格等痛點(diǎn)得到改善,為整個(gè)tws耳機(jī)市場(chǎng)帶來(lái)了巨大的增長(zhǎng)空間。
gfk數(shù)據(jù)顯示,2016年無(wú)線耳機(jī)出貨量?jī)H為918萬(wàn)臺(tái),市場(chǎng)規(guī)模不足20億元。到2018年,無(wú)線耳機(jī)出貨量將同比增長(zhǎng)41%,市場(chǎng)規(guī)模將達(dá)到54億美元。到2020年,tws無(wú)線耳機(jī)的市場(chǎng)規(guī)模將達(dá)到110億美元。
智研咨詢預(yù)測(cè),20182020年全球tws耳機(jī)將實(shí)現(xiàn)快速增長(zhǎng),出貨量分別達(dá)到6500萬(wàn)、1億和1.5億,年復(fù)合增長(zhǎng)率為51.9%。預(yù)計(jì)隨著無(wú)線耳機(jī)音質(zhì)和功能的不斷提升,以及人工智能語(yǔ)音app應(yīng)用的深度拓展,未來(lái)無(wú)線耳機(jī)的普及率有望繼續(xù)提升。
如此巨大的銷售增長(zhǎng)空間,讓每一個(gè)想進(jìn)入市場(chǎng)的有實(shí)力的廠商都有可能抓住商機(jī),騰飛。
了解更多airpods的語(yǔ)音喚醒siri(ai rpods語(yǔ)音功能)實(shí)用性如何?相關(guān)內(nèi)容請(qǐng)關(guān)注本站點(diǎn)。