公務員期刊網 精選范文 人臉識別的核心技術范文

人臉識別的核心技術精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的人臉識別的核心技術主題范文,僅供參考,歡迎閱讀并收藏。

人臉識別的核心技術

第1篇:人臉識別的核心技術范文

第二天各大媒體紛紛予以報道,國內涉足人臉識別概念的上市公司股票也紛紛上漲,各路資本對此也充滿興趣,相關技術創(chuàng)新公司先后成立,人臉識別成為了各類論壇展會關注的焦點,呈現出一片欣欣向榮景象。

巨頭和資本的共同選擇

近兩年,阿里巴巴對人臉識別越來越重視,在2014年就控股了一家人臉識別企業(yè),推動人臉識別的發(fā)展。2016年9月再次投資7,000萬美元收購美國生物驗證公司EyeVerify,進一步加深其在生物識別領域的布局。在內容方面,阿里巴巴已全面將該技術應用到自己的支付寶、淘寶等平臺,并將協(xié)同旗下的其它業(yè)務板塊等,培養(yǎng)人臉識別的應用場景。

除了阿里巴巴,BAT三巨頭中其他兩位也在此方面落下棋子。騰訊為此成立了專注于人臉識別的優(yōu)圖團隊,意在將騰訊征信、財付通、微眾銀行與人臉識別緊密相連。與公安部所屬的全國公民身份證號碼查詢服務中心達成的人像比對服務的戰(zhàn)略合作,讓騰訊的人臉識別技術可以7×24小時接入公安部查詢服務中心的數據庫。

百度更早在2012年在開始在人臉識別技術上發(fā)力,推出了當時國內第一款全網人臉搜索引擎以及百度魔圖PK大咖等明星產品,備受網民關注。近年來百度力圖將人臉識別技術應用于更多方面。如為了幫助丟失兒童的家人尋找孩子,百度利用人臉識別的人工智能技術開發(fā)了“百度尋人”公益平臺;“Dulight百度小明”可以通過語音識別、人臉識別等技術幫助盲人打理日常生活;最近被關注的烏鎮(zhèn)景區(qū)的人臉閘機,此技術也是由百度提供的。游客不用門票,只需“刷臉”就能在一秒內自由進出景區(qū),極大減少了排隊檢票的時間。

資本是市場的風向標,資本投向哪里,哪里就發(fā)光發(fā)熱。各路資本近幾年對人臉識別充滿熱情。2014年歐比特以5.25億元收購鉑亞信息100%股權,由此涉足人臉識別業(yè)務和智能安防領域;2015年4月佳都科技5,000萬元戰(zhàn)略投資專注于人臉識別智能分析算法及產品研發(fā)的云從信息科技;2015年10月佳都科技以2億元收購華之源51%股權,為公司的人臉識別技術在軌交領域的應用鋪設渠道;2016年2月遠方光電擬以10.2億元收購維爾科技 100%股權,切入生物識別領域。

此外,在人臉識別領域掌握一定核心技術的公司也紛紛成為資本的追逐對象,如曠視科技、依圖科技、商湯科技、飛搜科技等均獲得資本支持。在股市方面,主打人臉識別的上市公司也表現出了非常大的潛力,受到了股民的青睞。??低?、佳都科技、科大訊飛、海能達、賽為智能、漢王科技、高鴻股份等上市公司都呈現著不錯的表現。

為何受青睞

為什么如此多的資本和公司竟逐人臉識別呢?因為其廣泛的應用范圍和極大的發(fā)展?jié)摿Γ四樧R別幾乎可以在任何行業(yè)都得以應用。如金融行業(yè)可以進行刷臉登錄、遠程人臉開戶、自助人臉開卡;教育行業(yè)可以借助人臉識別技術確認考生身份;公安系統(tǒng)可以通過人臉比對篩查出犯罪嫌疑人;廣告行業(yè)可把人臉識別技術應用在戶外廣告上進行人流量統(tǒng)計;商業(yè)領域通過人臉技術可實現對用戶的年齡、性別、表情等識別和檢測,從而為商家對顧客進行精準營銷提供基礎的技術支持;社保系統(tǒng)可啟用人臉識別技術,規(guī)范領取人資格;機場利用人臉識別技術進行安檢。此外還可以進行刷臉開車、刷臉購物,刷臉取款、刷臉簽到等等。隨著未來人臉技術的普及,人只需“刷臉”就可真正解決現有生活中的諸多事情,帶來更為便利安全的生活。

與常用的密碼方式相比,人臉識別具有更高的安全性,任何賬號和密碼只要通過驗證都可以進行更改,而人臉識別則完全不同,人臉數據具有唯一性,幾乎是不可改變或改變成本非常高。與同樣具有唯一特性的生物指紋和虹膜識別技術相比,人臉識別無需用戶和設備直接接觸,無需用戶配合就可主動獲取人臉圖像信息,且可以進行多個目標的分揀、判斷及識別,因此操作起來更為方便快捷簡單。在推廣方面,當前普通攝像頭可以作為傳感器,人臉識別主要依靠人臉識別軟件和算法進行處理,普通攝像頭就可以作為采集人臉信息的傳感器,推廣起來成本比較低,客戶也較容易接受。

如今人臉識別發(fā)展最快的領域是安防。隨著城鎮(zhèn)化的進程加快,流動人口比例大大增加,面臨的突發(fā)事件和異常事件越來越復雜,給城市的安保工作以及視頻監(jiān)控帶來了更大的壓力。傳統(tǒng)依靠人工來盯的方式難免會因疲勞或精神不集中等原因影響監(jiān)視效果,難以勝任對龐大數據庫的分析,從而影響事后查找證據。

于是在國家政策支持下,近些年大力建設平安城市,具有智能分析的視頻監(jiān)控得以廣泛應用,大規(guī)模動態(tài)人臉識別、黑名單監(jiān)控、人流統(tǒng)計已分布在邊疆安防布控、機場、車站、景區(qū)、公共場所等。在部分地區(qū)的部分領域,人臉識別已經開始被列為使用過程中的強制標準。

這種情況的出現,對于人臉識別的推廣無疑是一種非常有力的推動。互聯(lián)網金融可能會是下一個發(fā)展較快的領域。中國由于人口基數大,互聯(lián)網普及程度高,人臉識別技術全球領先,互聯(lián)網金融業(yè)務通過遠程人臉識別身份證件核實的方式進行身份驗證,可有效解決面簽難題,人臉識別技術有望成為互聯(lián)網金融行業(yè)的標配。

技術在發(fā)展 市場超千億

人臉識別技術并不是近些年才有的,它的研究始于20世紀60年代,80年代后隨著計算機技術和光學成像技術的發(fā)展得到提高,進入初級應用是在90年后期,但并沒有規(guī)模推廣開,這是由于當時采用的是基于可見光圖像的人臉識別技術。

這種方式有著難以克服的缺陷,在環(huán)境光照發(fā)生變化時,識別效果會急劇下降,無法滿足實際系統(tǒng)的需要。后來出現的三維圖像人臉識別和熱成像人臉識別等解決光照問題方案,識別效果也不盡人意。直到基于主動近紅外圖像的多光源人臉識別技術的出現,它可以克服光線變化的影響,在識別性能,在精度、穩(wěn)定性和速度方面的整體系統(tǒng)性能超過三維圖像人臉識別。這項技術在近年發(fā)展迅速,使人臉識別技術逐漸走向實用化。

人臉識別是基于人的面部特征信息進行身份識別的一種生物識別技術。首先使用攝像頭或者攝像機采集含有人臉的圖像或視頻,之后根據所提取的人臉圖像特征采用相P識別算法進行人臉確認或辨別。隨后將已檢測到的待識別人臉與數據庫中已知人臉進行比較匹配,得出相關信息。該過程的關鍵是選擇適當的人臉表征方式與匹配策略,系統(tǒng)的構造與人臉的表征方式密切相關。一般根據所提特征而選擇不同識別算法進行度量,常用的包括距離度量、支持向量機、神經網絡、k均值聚類等。

第2篇:人臉識別的核心技術范文

10月10日投資界(PEdaily)網站報道:

無人便利店方案提供商YI Tunnel正式對外宣布已于7月完成了數千萬級別天使輪融資,由百度風投領投、峰尚資本跟投。本輪融資將主要用于線下場景布局、市場拓展等。

智能零售解決方案提供商YI Tunnel是誰?

YI Tunnel是一家主打AI+新零售的公司,通過圖像識別、人臉識別、動作語義識別等技術,主打兩大核心解決方案。方案一是:基于結賬等待及收銀員人力成本痛點,提供YI Tunnel AI無人收銀機;方案二是:致力于打造成本遠低于Amazon Go和淘咖啡的無人店。創(chuàng)始人吳一黎曾在甲骨文、IBM等工作8年,開發(fā)團隊來自主要來自清華大學信息學院。(PEdaily報道)

YI Tunnel與我們之前報告中提到的深蘭科技TakeGo、AmazonGo有什么相同之處?——AI、機器視覺是核心技術:三者皆采用了機器視覺(采用神經網絡)識別,之前采用RFID識別的繽果盒子近期也開始研究采用機器視覺方案。

三者有哪些不同?(1)入場方式:①YI Tunnel為掃臉入場;②深蘭科技TakeGo為刷手入場(手掌靜脈毛細血管識別);③AmazonGo為掃碼入場。(2)結算方式:①YI Tunnel需要將貨物放在無人收銀機上進行機器視覺識別(參見器官網視頻);②深蘭科技TakeGo為消費者拿取商品時時機器視覺識別,直接離場(拿了就走);③AmazonGo為機器視覺+RFID混合識別方式離場。

為什么要關注百度風投(BV)在AI零售的動向?

百度風投(BV)于2016年成立,專注于AI領域投資,由李彥宏親自賤人董事長和投委會主席。百度風投(BV)是由百度2016年發(fā)起成立的獨立風險投資機構,目前管理著2億美元規(guī)模的首期雙幣基金,致力于成為AI時代的世界一流VC。在管理機制上,李彥宏將兼任董事長和投資委員會主席,將參與一些重要項目的評估和決策。此外,百度風投還將邀請包括百度在人工智能領域的一批科學家擔任顧問,為投資決策和投后管理提供支持。

阿里、百度相繼出手,AI零售PE/VC市場風起云涌,預計將加速“新零售”相關產業(yè)的發(fā)展

第3篇:人臉識別的核心技術范文

現在,經過幾個世紀的孕育發(fā)展,生物技術已進入了一個全新的發(fā)展階段??萍疾肯嚓P負責人日前表示,生物技術是我國發(fā)展最快、潛力最大、與國外差距最小的領域之一。可見,生物技術的發(fā)展勢頭之迅猛在產業(yè)發(fā)展史上是罕見的。人們已認識到生物技術已逐步成為當今高新技術群體中最富有活力的領域之一,并與信息技術、納米技術、新材料等其他高技術相互結合,正在全球范圍內形成增值產業(yè)鏈,它的新概念和方法正帶動農業(yè)、醫(yī)藥、食品、能源、化工、環(huán)保等多領域技術的共同進步。發(fā)展生物技術對解決當今人類社會面臨的糧食、能源、資源、環(huán)境和健康等許多重大問題具有重要的現實意義和深遠的戰(zhàn)略意義。更重要的是,利用好生物技術,能夠有力的提升一個國家的生物安全?,F代研究已經證明,生物技術的危害遠遠大于核武器,因此生物安全已經成為國家安全的關鍵點。

2007年1月29日,全國科技工作會議在北京召開,科技部部長徐冠華在會上明確指出:“十五”期間,一批關乎經濟社會發(fā)展的重大技術被攻克。在生物技術領域中,尤其在超級稻育種技術、新藥創(chuàng)制等領域取得了重大突破;超級稻育種技術繼續(xù)保持世界領先; “863”計劃共有15個品種獲得一類新藥證書,109個新藥品種進入臨床試驗階段。他還表示,科技部將在今年年內正式啟動實施若干項重大專項。在確保國家重大專項實施的基礎上,在重大醫(yī)療器械設備、海洋資源與環(huán)境等領域實施重點專項。會上還提出了2007年科技工作的新亮點,將在綜合交叉和重要科學前沿領域進行重點部署,組織實施干細胞、蛋白質、生殖與發(fā)育等科學研究計劃,并在蛋白質科學等領域籌建10個國家實驗室。

在21世紀的今天,世界各國都在由政府牽頭,大力發(fā)展本國生物工程技術產業(yè)。發(fā)達國家均將生物技術及其產業(yè)列為戰(zhàn)略高技術和新興產業(yè)發(fā)展的重點。面對生物技術不斷取得突破所帶來的發(fā)展機遇,我國政府也高度重視,在“十五”高新技術產業(yè)發(fā)展規(guī)劃中,生物技術產業(yè)被列入國家十二大高新技術工程,在國家“863”技術和科技攻關計劃的支持和推動下,國內生物技術產業(yè)向著國際化方向邁步。

由此可見,我國生物技術與產業(yè)已經開始從跟蹤仿制到自主創(chuàng)新的轉變,從實驗室探索到產業(yè)化的轉變,從單項技術突破到整體協(xié)調發(fā)展的轉變。生物技術的應用將會大幅度提高人類的健康水平,并可以引起醫(yī)藥的第四次革命浪潮。

轉基因新藥將進入臨床試驗

項目簡介:轉基因動物是利用細胞分裂,染色體倍增原理,通過實驗的方法,將人或哺乳動物的某種功能基因導入哺乳動物的受精卵(或早期胚胎細胞)里,使導入的基因能夠與受精卵的染色體DNA整合在一起。隨著細胞分裂染色體倍增而倍增,使動物體內的每一個細胞都帶有導入的基因,并能夠將其穩(wěn)定地遺傳到下一代的同類動物。其不僅徹底將基因的培育工作從實驗室轉移到動物體內,還能通過動物自身的繁衍生殖。

項目負責:醫(yī)學遺傳學專家曾溢滔院士。

項目進展:在未來5~10年內,轉基因新藥在我國就能進入臨床試驗階段,開始引領新一代醫(yī)藥產業(yè)。

意義:應用轉基因動物乳腺生物反應器技術制造藥物是一種可以獲得巨額經濟利潤的新型產業(yè)。

基因工程乙肝疫苗研究

工程簡介:近年來乙肝疫苗占據了主導地位,在生物制藥領域,乙肝疫苗在市場上是巨頭。

目前,乙肝新疫苗保護的靶對象正逐漸擴展為慢性肝病患者和肝炎病毒攜帶者,國外在單一抗原HBV疫苗基礎上開發(fā)了多種抗原疫苗,臨床表明預防甲肝、乙肝有效率在98%以上,因此合并有S抗原的Bio-Hep-B和Hepagene有望能替代現在廣為使用的重組疫苗;預測到2010年,相繼問世的疫苗將占HBV疫苗市場的20%,DNA疫苗、口服植物性疫苗、聯(lián)合疫苗、治療性乙肝疫苗有望成為新的熱點。尤其是治療性乙肝疫苗與現有抗HBV藥物聯(lián)合應用,將是肝炎新療法之一,在這一方面,江蘇復旦悅達生物技術擁有我國自主知識產權的乙肝治療性疫苗已完成臨床研究,商品名為乙克。

工程負責:江蘇復旦悅達生物技術公司

進展與意義:目前乙肝疫苗尚在研究中。它是21世紀最具前景的疫苗品種,中國疫苗市場目前處在起步階段,從市場規(guī)模到消費觀念均有較大的發(fā)展空間。

糖尿病及各種疾病臨床營養(yǎng)支持治療學研究

簡介:該系統(tǒng)根據各種計算公式與方法設計診療方案,并利用計算機完成各種運算,綜合中醫(yī)飲食療養(yǎng)學及現代營養(yǎng)學之所長,能夠實施對患者終生飲食治療的科學指導,有力支持藥物治療及體育療法,有利于控制糖尿病的發(fā)展,預防各種并發(fā)癥的出現。

飲食療法雖然是糖尿病治療諸多環(huán)節(jié)中最重要、最基礎的措施,但是由于以往常用的飲食療法存在公式復雜、計算繁瑣、食譜固定、適用性差,因此不容易滿足患者飲食習慣的需求,致使患者飲食治療不到位,血糖控制不理想,不得不加大藥物的劑量,一方面增加了潛在的藥物副作用對人體的傷害,另一方面使患者背負了更大的經濟負擔。 “糖尿病及各種疾病的臨床營養(yǎng)支持治療系統(tǒng)”在設計思想中,充分考慮了融合中西醫(yī)特色,旨在取長補短,以提高糖尿病飲食治療的效果。力求達到畫面清晰、操作簡單、使用方便。由于該系統(tǒng)設計良好的人機對話平臺界面,最終的結果均需通過人機交流來決定,能為每一位患者提供更人性化、個體化的科學、合理、全面的膳食指導,不僅能夠充分尊重個人的飲食習慣,而且大大加強飲食療法的可操作性。

突破:本系統(tǒng)根據中醫(yī)藥學的特殊需要設計完成了中醫(yī)飲食療養(yǎng)庫。在中醫(yī)食物療養(yǎng)庫的文字錄入程序中,實現了中文智能識別的快速、批量、準確的目標,同時利用模糊識別的方法檢索查詢中文信息,在完整保留古代資料的前提下,一方面最大限度地減少漢字數據冗余,另一方面大大提高了檢索的精度及廣度。

意義:“糖尿病及各種疾病的臨床營養(yǎng)支持治療系統(tǒng)”的開發(fā)成功,為上述問題的解決,搭建了一個簡易的中文工作平臺。并具有極強的計算、統(tǒng)計相關數據及打印功能,更有利于該項成果的迅速推廣應用。

生物芯片檢測儀

簡介:該設備是上海裕隆生物科技有限公司開發(fā)的用于生物芯片反應結果檢測的自動化儀器,采用了光機電一體化技術,能夠全自動攝取、處理、分析、打印生物芯片檢測結果,采用了自動找點技術,智能性高,具有掃描范圍大、掃描速度快、靈敏度高、信噪比高、全自動定位圖像分析技術、全自動數據分析處理、操作簡便等特點,適用于利用化學發(fā)光原理的生物芯片反應結果的檢測。

進展:目前該項目處于中期階段。

意義:可用于科學研究、教學實習以及臨床檢驗等多個領域,市場面向醫(yī)院、體檢中心、血站等醫(yī)療衛(wèi)生機構和科研院所。

生物芯片進行骨髓分析處理技術

技術簡介:一種利用生物芯片對骨髓進行分析處理的技術, 是把多個捐獻者的基因樣本采集到一張生物芯片上,同時進行分析處理。而以往的技術一次只能對一個樣本分析處理。這種用于骨髓分型的生物芯片,只有手指大小,僅一張就可以存儲上萬個人的白細胞抗原基因。據介紹,對人類白細胞抗原基因進行分型是進行器官移植和骨髓移植的前提,在我國,這種技術長期依賴進口,價格很高。每進行一份骨髓分型,就要支付500元費用。

技術進展:據介紹,目前美國骨髓庫數量接近600萬人份,而中國只有36萬人份,難以滿足患者的成功配型需要。如果要達到美國現在的水平,用通用的技術至少要20年,而采用生物芯片技術,時間可以節(jié)省一半,費用將節(jié)省1/3。

意義:日前由生物芯片北京國家工程研究中心研制成功,這在全球尚屬首次,它可以大大提高骨髓分型的速度和準確度。

生物特征識別核心技術研究

技術簡介:該課題是在人臉檢測、面部特征提取、人臉識別與確認等核心算法、關鍵問題解決方案、應用系統(tǒng)設計等領域的成就。在課題組完成的二十余種算法中,大部分是獨立提出的,有一部分是對現有算法的優(yōu)化和改進,而且成果已獲得實質性應用。在指紋識別方面,提出了混合模型的定義和復有理多項式的方向圖模型等一種新的基于模型的指紋奇異點求取方法,并首次提出了斷紋的概念,在相關成果的基礎上實現了一個用于門禁的指紋識別系統(tǒng)。在掌紋識別、在線簽名認證和多生物特征融合方面,獨創(chuàng)地給出了皺紋的定義,并設計了一種新穎的方向圖計算方法來準確的計算點的方向。完成了由皺紋點到皺紋的折線段描述。實現了一種融合人臉和指紋的身份認證系統(tǒng)。

技術突破:在基于人臉重心模板的實時人臉檢測、基于自適應樣本重采樣技術的實時人臉檢測、基于遺傳算法的學習集擴展方法、結合人臉圖像加光技術的特定人臉子空間人臉識別、基于變換域子空間判別分析的人臉識別與確認、基于球面諧波的光照估計和光照補償策略、基于3D重建的姿態(tài)校正方法、誤配準災難問題研究、基于AdaBoost的人臉識別方法、基于多分量統(tǒng)計子空間判別分析等研究方面達到了國際領先水平。生物特征識別技術在國家機關及社會安防領域具有廣泛而特殊的用途。

技術進展:該項目處于中期階段。

意義:研究成果整體處于國內領先、國際先進水平。

高強度淺封堵技術研究

技術簡介:隨著人們對微觀力學和宏觀力學的研究,提出了通過緊密堆積理論和材料顆粒大小分布來提高材料的宏觀力學性能的技術思路,通過調節(jié)混合物固相的不同顆粒尺寸分布,進行級配和加工,使堵劑體系含有多種尺寸顆粒,實現良好的孔隙充填和混合物的緊密堆積,即單位體積堵劑中含有更多固相,從而得到高性能的堵劑。新型高強度堵劑主要由主劑、減輕劑、增強劑以及相配套的分散劑、懸浮劑等外加劑組成,采用減輕劑、增強劑兩種材料復配使用,既滿足了密度指標的要求,又保證了漿體的沉降穩(wěn)定性。現場可根據施工需要配制出密度1.3 g/cm3~1.9g/cm3,適應溫度為室溫~150℃的堵劑。

成果分析具體如下:1.研制出高強度堵劑的主體配方并分析了堵劑各組分的變化對堵劑性能的影響。 2.通過巖芯試驗表明堵劑對不同滲透率巖芯都具有很強的堵塞能力,滲透率在20μm2左右的巖芯的堵塞率達98%以上,10μm2左右?guī)r芯(長度為24cm)突破壓力在10MPa以上。 3.進行了8口井的現場試驗,成功率100%,累計增油5000余噸,創(chuàng)產值200多萬元,取得顯著的經濟效益?,F場試驗表明其對高滲透層(或大孔道)具有非常強的封堵作用,可用于注水井調剖施工及油井堵水施工。 4.高強度堵劑具有較強的自然選擇性能,能夠優(yōu)先進入高滲透層(或大孔道)、帶并形成有效封堵。 5.高強度堵劑具有較廣的適應性,可用于砂巖、灰?guī)r等不同地址特征條件下的調剖堵水施工。

技術進展:目前處于中期階段,該項目經過一年的研究工作,取得了顯著成果,達到了預期目標。

“中科紅”海灣扇貝繁育

簡介:“中科紅”海灣扇貝是在張福綏院士引進海灣扇貝的基礎上,突破構建海灣扇貝自交系和雜交系的技術障礙,構建了“殼色-生長”育種模式,培育出橘紅殼色、性狀優(yōu)勢明顯的海灣扇貝新品種,其生長速度較海灣扇貝常規(guī)養(yǎng)殖對象提高 15.6%,成活率提高 19.2%。同時也創(chuàng)立了貝類家系育種新途徑,構建了新的育種模式。

專家介紹,對繁育的“中科紅”海灣扇貝苗種數量和規(guī)格都進行了隨機取樣測量,并采用目測法對殼色純度進行了檢驗。檢驗測量結果顯示:“中科紅”海灣扇貝苗種數量2544萬粒,平均個體殼高2.6±0.5 mm,最大個體殼高3.5mm,最小個體殼高1.5 mm。紅殼色個體比例達92%以上。

第4篇:人臉識別的核心技術范文

近日,在漢王科技新產品體驗周即將拉開序幕之際,本報記者獨家專訪了漢王科技副總裁王杰。他的講述,不僅讓記者見識了漢王科技的新產品、新變化,更讓記者深刻體驗到,一家致力于自主研發(fā)的民族企業(yè),如何在激烈的市場競爭中長久地立于不敗之地。

多款新品集中

在北京上地的漢王科技大廈的一層新布置的展廳中漢王科技的多款新產品展現在記者面前。

“E典筆A30T是在A10T基礎上的升級,實現了聯(lián)網功能,用掃描筆對紙面的文本進行掃描后,只需按一下按鈕,就可以將掃描的內容上傳到云空間上,這樣,更方便用戶用電腦、手機對上傳內容進行訪問、編輯、拷貝等操作?!?作為漢王科技研發(fā)方面的負責人,王杰一說起新產品就滔滔不絕。

據悉,E典筆中內置了識別芯片,可將掃描到的書面文字瞬間轉換成文本字符,并通過內置的牛津詞典進行即時翻譯。如果用戶想獲得更準確的整句翻譯,就可以將文件上傳到云空間中,在云端利用軟件完成翻譯后,再下載到E典筆上顯示出來。顯然,這款產品非常適合學生進行讀書和學習,同時也便于研究人員用它查閱科技文獻資料。

此次,漢王科技集中展示的新產品還有E930電紙書、霾表、空氣凈化器等產品,以及人臉識別、數據處理等行業(yè)解決方案。王杰介紹說,在很多產品上,漢王科技都做了很多創(chuàng)新。比如E930電紙書產品,不僅將顯示屏的尺寸加大到9英寸,還配備了專用的電容筆。用戶在使用E930電紙書的時候可以邊錄音邊記筆記,同時可以為錄音添加標簽。當用戶用筆點擊標簽時,錄音就會跳轉到相應的段落,而不需要通過快進的方式尋找。

在空氣檢測和凈化方面,漢王科技也已經進行了很長時間的研發(fā),使用與其他廠商完全不同的方式實現空氣凈化。霾表可以讓用戶隨身攜帶,隨時測量周邊環(huán)境的PM2.5數值。即將上市的大型空氣凈化器則主要面向廠區(qū)、樓宇、會議室等大型環(huán)境空間,在短時間內對大體積的室內空氣進行凈化,迅速消除空氣中的粉塵污染。

重視研發(fā)的基因源于創(chuàng)始人

在業(yè)內,漢王科技一直以重視自主研發(fā)而著稱,即便在非常困難的情況下,漢王科技依然保持著對研發(fā)的高投入。王杰認為,重視研發(fā)工作已經成為漢王科技的重要基因,而這與公司的創(chuàng)始人、董事長劉迎建的個人經歷密切相關。眾所周知,劉迎建本人就是研發(fā)出身,漢王科技就是他帶著自己的科研成果下海創(chuàng)立的。所以,在他的帶領下,漢王科技一直非常重視技術的研發(fā),而且在這方面投入的資金一直很多。

王杰表示:“在漢王科技涉足的每個領域,我們都有幾個頂尖的專家。這些人才為什么愿意留在漢王科技?因為我們的創(chuàng)始人非常重視人才,給他們提供了廣闊的創(chuàng)新空間,讓他們的才能得到最大限度的發(fā)揮。同時,我們給研發(fā)人員的地位和待遇都是非常高的,即便是在漢王科技業(yè)績不好,需要削減各項預算的時候,也優(yōu)先保障研發(fā)預算不減少。這一點,從我們的財報中可以清楚地看到?!?/p>

正是有了這樣的基因,漢王科技才能始終堅持將自主研發(fā)置于公司工作的重中之重,也才有可能在相關領域始終保持著技術領先的優(yōu)勢。

“比如E典筆產品,目前我們基本上沒有競爭對手,因為我們擁有核心的光學掃描技術,其他廠商目前還無法實現這一功能。即便有的廠商做出了類似的產品,其識別的準確度也無法和我們相比。”王杰介紹說,E典筆只有一般簽字筆的大小,筆頭卻能將掃過的書面文字快速掃描下來,并拼接成一幅完整的圖片,而且還要在很短的時間內將掃描的文字轉化成可編輯的電子文本,這中間要解決很多技術難題。

如果用戶掃描下來的文字不在一條直線上,系統(tǒng)要對圖像進行糾偏;如果書面的字體是紅色的,底色是黃色的,系統(tǒng)要對圖像進行二值化識別……總之,E典筆在掃描書面文本的一剎那,需要做很多的處理,然后還要保證99%的識別正確率,這是非常困難的。

除了傳統(tǒng)優(yōu)勢的手寫識別和OCR技術外,漢王科技還在無線無源電磁筆、PM2.5檢測凈化、人臉識別等領域擁有國際領先的技術。

王杰自豪地表示:“目前,全世界范圍內,能夠提供無線無源電磁筆產品的只有兩家企業(yè),一家是日本企業(yè),另外一家就是漢王科技。”

更好地體現創(chuàng)新價值

坦率地講,漢王科技的經營業(yè)績,一直無法與其所擁有的技術實力和科研成果相匹配。在互聯(lián)網思維被廣泛采用的今天,更是有一些以營銷見長的企業(yè)得以快速成長。漢王科技是否應該適時調整企業(yè)的經營思路呢?對此,王杰堅決地表示,漢王科技是一家技術驅動型的創(chuàng)新企業(yè),必須堅持自主研發(fā),這個根基堅決不會動搖。

從外部環(huán)境看,國內對企業(yè)自主創(chuàng)新技術的認可程度還不足。目前,漢王科技在產品方面走的是軟硬結合的道路,通過功能強大的硬件,讓用戶認可其中軟件的價值。

此外,漢王科技也在內部做了大刀闊斧的組織架構調整,將之前的研發(fā)中心和營銷中心兩大體系,轉變?yōu)橐援a品為運作單元的獨立子公司架構。這樣調整的好處顯而易見――各個產品子公司都會圍繞產品進行研發(fā)和銷售,責權利更為明確,可以極大地調動相關銷售人員的銷售積極性。王杰自信地表示:“目前,公司的內部調整已經基本完成,從漢王科技2014財年的半年報也可以看出,我們已經重新走上了盈利的軌道。所以,現在是我們重新樹立漢王科技新形象的時候了。”

目前,漢王科技已經將自己的核心技術和產品應用到了很多重要的行業(yè)。例如,漢王的手寫識別技術已經應用到了銀行的柜臺服務業(yè)務中。

以前客戶辦理業(yè)務需要先填寫相應的單據,再由銀行的柜臺服務人員進行錄入,然后打印出來讓客戶確認、簽字。而采用了手寫識別技術后,用戶可以直接在手寫板或手寫屏上填寫相關信息,省去了營業(yè)員大量繁瑣、重復的勞動。

在云計算大潮下,漢王科技根據自身產品的技術特點,也已經開始為客戶提供幾類云計算的解決方案。王杰介紹說,漢王科技目前的云計算業(yè)務分為幾類:一是設備云,就是將漢王的產品與云連接,讓用戶通過漢王的產品享受云服務;二是公有云,就是漢王科技將自己開發(fā)的APP產品放到云端,供用戶下載使用,比如名片識別程序、人臉比對軟件等;三是開發(fā)者云,就是幫助各類軟件開發(fā)者方便地調用漢王科技的相關應用程序,比如有文字識別需求的開發(fā)者可以將信息發(fā)送給漢王科技的相關云應用,漢王科技在云端做完文字識別后再將識別后的結果傳送給開發(fā)者;四是私有云,當那些注重數據安全的用戶在構建自己的私有云時,漢王科技可以提供相應的授權,讓用戶將漢王的技術和解決方案囊括其中。

第5篇:人臉識別的核心技術范文

關鍵詞:人工智能;本科高年級教學;教學改革

中圖分類號:G642 文獻標識碼:B

1 引言

人工智能是計算機科學與技術學科類各專業(yè)重要的基礎課程,在信息類相關的許多高年級本科和研究生都開設了人工智能課程。人工智能是一門前沿性的學科,它主要研究計算機實現智能的基本原理和基本方法,同時人工智能也是一門多學科交叉的綜合學科,它涉及計算機科學、數學、心理學、認知科學等眾多領域。廣義的人工智能涵蓋了模式識別、機器學習、數據挖掘、計算智能、神經網絡、統(tǒng)計學習理論等眾多研究方向。人工智能作為計算機學科的重要分支,已成為人類在信息社會和網絡經濟時代所必須具備的一項核心技術,并將在未來發(fā)揮更大的作用。

由于人工智能課程的學習難度較大,內容更新比較快,也繁多,使得教學有一定的難度。特別是針對本科高年級的人工智能教學,由于本科生的研究意識相對較弱,而人工智能比較強調科研性,所以如何教好本科高年級的人工智能課程是一項非常具有挑戰(zhàn)性的任務。

本文通過分析本科高年級的教學特點和人工智能課程的自身特點,在如何提高教學質量這一問題上提出了幾點思考。

2 本科高年級的教學特點

中國的本科教育,由于歷史和經濟發(fā)展水平等諸多原因,目前的定位還是培養(yǎng)某方面專業(yè)人才的專才教育。本科高年級學生在完成了低年級公共基礎課程和部分專業(yè)基礎課程的學習之后,迫切希望了解本專業(yè)的應用領域和發(fā)展前景,所以在教學過程中要注意內容的應用性和專業(yè)性。另一方面,本科高年級學生也是研究生教育的儲備人才,在教學過程中要適時的進行科研引導,這樣能夠讓畢業(yè)生保持對科學的興趣,從而為研究生階段進一步深入研究打下基礎。本科生一般于4年級的10月份開始著手畢業(yè)設計,在本科高年級的教學過程中還要注意與畢業(yè)設計的內容相結合,這樣可以讓學生提前做好準備,選擇適合自己的方向。

3 人工智能課程的學科特點

與信息類其它專業(yè)課程相比,人工智能具有應用性、研究性和發(fā)展性三個重要學科特點。首先,人工智能是一門應用性很強的學科。人工智能學科的主要目標在于研究用機器來模仿和執(zhí)行人腦的某些智力功能,并開發(fā)相關理論和技術。人工智能技術廣泛應用于模式識別、數據挖掘、智能控制、信息檢索、智能機器人等領域,在日常生活中,隨處可見人工智能技術的應用實例;其次,人工智能技術具有很強的研究價值,是計算機科學領域中重要的研究方向。技術進步無止境,研究者們不斷追求開發(fā)出效率更高、更智能的人工智能技術:最后,人工智能是一門正在發(fā)展中的學科。隨著信息化、計算機網絡和Internet技術的發(fā)展,人類已步入信息社會和網絡經濟的時代,它們?yōu)槿斯ぶ悄芴岢隽嗽S多新的研究目標和研究課題,人工智能的應用領域以及技術算法都在不斷發(fā)展。

4 人工智能教學的三點思考及對策

4.1 注重應用性和介紹性

在教學實踐中,筆者發(fā)現,本科高年級學生一般比較關心各種人工智能技術的應用領域和使用方法,而對基礎性理論和技術細節(jié)不是很感興趣。他們一方面希望能學到很多較新和較實用的人工智能算法,并且最好可以看到使用效果;另一方面又希望老師的教學主要停留在介紹性層面,不想花太多時間在復雜的理論理解上。這也比較符合本科高年級的教學特點,本科階段主要是培養(yǎng)具備較強應用性和基礎科研素質的專業(yè)人才。傳統(tǒng)的人工智能教學主要講授知識表示和搜索推理技術,大部分實例都是解答式或推證式的。由于其知識的抽象性,又加之其應用實例較少,所以往往教師感覺難講,學生在學習過程中也感覺乏味,對講授的內容大多都是死記其方法和步驟,因此影響了教學效果。針對這一問題,筆者認為,在設計人工智能教學時,要注重內容的新穎性、實用性和介紹性。除了講授那些仍然有用的和有效的基本原理和方法之外,要著重介紹一些新的和正在研究的人工智能方法和技術,特別是近期發(fā)展起來的方法和技術,如支持向量機、決策樹、模糊集、遺傳算法、蟻群算法等。這些內容的理論部分可以不必過分深究,教學重點主要放在介紹每種技術的產生背景、發(fā)展狀況、應用領域和具體實現上。此外,要注意理論與實際應用密切結合,在教學過程中加入一些與課程內容結合的、可以用計算機實現的實際應用內容??紤]到目前應用最廣泛的人工智能領域之一是模式識別,而研究模式識別的主要計算機工具是Matlab,所以筆者在教學過程中以手寫數字識別作為教學實例,針對所介紹的每一種人工智能技術,都將其應用于手寫數字識別當中,并講解了這些技術的Matlab實現方法。學生在掌握了基本理論之后,可以按照實現步驟的指導,立刻上機見到算法的實際效果,加深對算法實現思路和方法的認識。

4.2 注重科研引導性

本科教學不僅要培養(yǎng)學生的應用能力,還要培養(yǎng)學生具備基本的科研素質。本科教育一方面為社會培養(yǎng)了大批應用型人才,另一方面也要為我國的科研事業(yè)培養(yǎng)后備力量。特別是近幾年來我國對科研的投入不斷增加,研究生招生規(guī)模逐年增大,本科高年級學生打算繼續(xù)讀研的也不在少數。而人工智能是計算機相關學科非?;钴S的研究課題,其涵蓋的分支非常廣泛,如模式識別、機器學習、數據挖掘、計算智能、統(tǒng)計學習理論等,都是目前國際和國內熱門的研究方向。針對這一特點,在本科高年級的人工智能教學中,還要注意對學生適時適度的科研引導。這樣可以激發(fā)學生的研究興趣,樹立目標意識,找準研究方向,為未來的科研工作打下基礎。在教學過程中,可以引導學生思考每種人工智能技術的優(yōu)點是什么?缺點是什么?有沒有改進的辦法?比如BP神經網絡是計算智能中較為成熟的技術,具有強大的非線性學習能力,在模式識別、經濟數據分析、生物信息學、數據挖掘等眾多領域都取得過成功應用。然而BP神經網絡算法自身也存在著一些缺點,如會有局部最小解、解受初值影響較大、理論解釋不完善等。近十年來,研究者逐漸把目光轉移到另一種新的非線性學習工具――支持向量機上。同神經網絡相比,支持向量機具有泛化能力強、不受局部最小問題困擾、理論背景完善等顯著優(yōu)點。在給學生講解BP神經網絡算法的時候,一方面可以通過手寫數字識別實驗展示其強大的非線性分類能力,另一方面也要告訴學生,BP神經網絡并不是完美的,其缺點同樣明顯。然后引導學生對這些問題進行思考,討論有沒有更好的解決辦法。此時,順勢引出支持向量機的內容,并且介紹支持向量機的研究現狀和研究方向。通過兩者的對比,學生不但了解到了較新的人工智能技術,又對人工智能研究中如何去發(fā)現問題、解決問題、人工智能技術的進化歷程有了直觀的印象。

4.3 教學內容與畢業(yè)設計相結合

本科畢業(yè)設計是對本科生用所學知識來解決實際問題和進行專業(yè)研究能力的檢驗,是本科高年級學生將要面臨的一項重要任務。由于人工智能學科具有應用性和科研性的特點,人臉識別、網頁檢索、經濟預測、基因數據處理等應用領域都離不開人工智能技術,所以人工智能方向為學生提供了豐富的畢業(yè)設計選題。針對這一特點,在本科高年級的人工智能教學中,可以適當穿插介紹有關畢業(yè)設計的內容。告訴學生哪些應用領域是目前人工智能研究的熱點方向,哪些人工智能技術可以用來解決這些問題。通過向學生介紹具有一定應用價值和研究意義的題目,然后引導他們查找閱讀相關技術文獻,分析問題,解決問題,最后編寫代碼和撰寫論文。比如筆者給學生提供的選題包括:(1)基于支持向量機的上市公司信用評價;(2)正則化回歸在股票預測中的應用;(3)基于膚色的人臉檢測;(4)基于內容的網頁圖像檢索等。這些題目應用性強,具有一定科研深度但是難度又不至于太大,學生選擇這些題目的積極性很高。通過將教學內容與畢業(yè)設計相結合,不但加深了學生對課程的理解,又使其找到了合適的畢業(yè)設計題目,可謂一舉兩得。

第6篇:人臉識別的核心技術范文

41歲的科大訊飛董事長劉慶峰已經很久沒有抬頭看這行字,自今年初制定了由B2B戰(zhàn)略轉型B2B2C戰(zhàn)略之后,他更忙了。

十余年來,智能語音一直無法擺脫“玩具”的清冷形象,沒人否認這個技術的先進性,但如何利用這個技術賺錢,也沒有人能想清楚。

科大訊飛發(fā)軔于中國科技大學,1999年創(chuàng)業(yè),一直到2004年才實現盈虧平衡。其創(chuàng)始人劉慶峰在創(chuàng)業(yè)之初認為很快就可以做到100億元,很快就能上市,事實上科大訊飛2008年上市時,才做到1億多元的年銷售收入。整個過程充滿艱辛。

以2009年中國正式商用3G為轉折點,科大訊飛從谷底爬升。時至今日,已經在機器合成語音市場占到了70%以上的份額。2013年,訊飛營收為12.5億元,這個數字比2012年增長60%。

有研究機構預測,智能語音的市場容量至少超過30億美元。和千億美元的市場相比,這只能算是一個小市場。但鑒于物聯(lián)網和可穿戴設備的廣闊前景,智能語音的入口級意義更為可觀。

這被劉慶峰視作一個好機會。與其繼續(xù)在后臺為其他公司作嫁衣裳,不如自己卷袖單干,直接做終端消費者的生意。

劉慶峰選擇以智能家居為突破口。他希望推動一場“從手控到聲控”的智能家居變革,通過發(fā)出語音指令來實現開燈、調光,開關電視、空調等智能家電的動作,進而實現整個家庭的智能交互。

劉慶峰畫了一個餅。這個餅能幫助訊飛突破市場限制,做更大的生意,但風險也是可估的。科大訊飛開始了二次創(chuàng)業(yè)。 跋涉商業(yè)模式

在市場幾度變化沉浮之后,訊飛才最終找到一個適合自己的節(jié)奏。

智能語音技術原理復雜,技術開發(fā)周期長、投入大,進入壁壘很高。在全球范圍內,目前已形成寡頭壟斷競爭格局,僅有Nuance、IBM、微軟、Google、科大訊飛等少數廠商具備較強競爭力。

我國語音技術廠商基本分為三類:一是傳統(tǒng)語音技術廠商,包括科大訊飛、捷通華聲;第二類是互聯(lián)網廠商,包括百度、騰訊、搜狗等,普遍采用戰(zhàn)略合作或者收購等方式,掌握智能語音技術,推廣語音服務;第三類是創(chuàng)業(yè)企業(yè),像云知聲、思必馳等,它們專注于某些行業(yè)領域如汽車、家電,推廣自己的語音技術和產品。

科大訊飛幾乎是智能語音領域起步最早,目前也是唯一能夠與國際巨頭抗衡的公司。而在長達15年的時間里,這家公司曾經一度找不到方向。

1999年底,融資3000萬元之后,科大訊飛成立,公司有兩個目標,一個是做全球最大的中文語音技術提供商,二是做全球最出色的多語種語音技術提供商。

劉慶峰覺得市場空間很大,馬上就能做到。但在接下來的幾年里,他備受煎熬,“這個東西很好,技術也在不斷提高,但不知道從哪把錢掙回來。”

當時,IBM、微軟等國際大公司雖然都把智能語音業(yè)務當作未來的潛力業(yè)務,但他們都只是布局,并不抱掙錢的念頭。

而劉慶峰期望更大,第二年就推出面向消費市場的話王98和暢言2000等兩款產品,用以幫助一些特殊人群操作電腦。當時,立下了創(chuàng)造100億元營收的目標。但因技術障礙和高昂的終端維護成本,這兩個產品最終失敗。

這與當時的產業(yè)發(fā)展環(huán)境有極大關系。當時,中國無線網絡仍在2G時代,除了客服中心和視力殘疾的特殊人群,語音識別技術過于超前,應用環(huán)境根本不存在,那些看上去很好的功能都是擺設。

虧損燒錢的狀態(tài)讓劉慶峰每晚失眠,核心技術人員怨聲載道,投資人聯(lián)想之星的財務總監(jiān)甚至當場在業(yè)績會議上流下眼淚。

那次失敗讓劉慶峰意識到,一個十幾個人的創(chuàng)業(yè)團隊做消費者市場過于理想化,他轉而做B2B市場,帶著團隊找了聯(lián)想、華為,勸說他們把訊飛的技術推廣到聯(lián)想的筆記本和華為的呼叫中心上。

他回憶,那是一個不斷“推”和“磨”的過程,要說服這些大廠商去用,但最終還是用戶說好才管用,因此需要做出多種應用去引導用戶。通過這種方式,訊飛的收入從一個月十幾二十幾萬元,生生到幾十萬、一兩百萬元。

直到2004年,訊飛實現盈虧平衡。此后,在技術和市場兩方面,訊飛都開始爬坡。2008年上市,訊飛的年銷售收入達近2億多元。后得益于移動互聯(lián)網的迅猛發(fā)展,訊飛長期的技術積累也得以發(fā)揮,最好的時候,中國十大IT電子公司中,有八家是采用訊飛的語音交互技術方案。

但這仍然無法與其他走在前列的巨頭相抗衡。蘋果的Siri已經廣為人知,谷歌“OK Google”的語音控制命令也很搶眼,微軟則在實時翻譯領域占據主導地位。

經過多年積累,語音交互技術最終成為了上述巨頭旗下的一個重要應用分支,成為它們在生態(tài)系統(tǒng)布局上的一個得力工具。得益于平臺,這些語音交互技術可以產品的方式直面消費者。而訊飛則久久止步于B2B市場領域。

資深業(yè)內人士陳志剛向《財經》記者表示,智能語音服務只是一個依附性的產品,必須依靠別的產品而存在,就像豬和毛的關系。 走向應用前臺

今年9月,科大訊飛輪值CEO吳曉如告訴《財經》記者,訊飛語音助手APP“靈犀”的用戶已經超過了1.6億。其中,運營商商店下載和第三方應用商店用戶量各占一半。

劉慶峰稱,靈犀輸入法的用戶遠遠超過百度和搜狗,甚至超過了后二者的總和。但這個很牛的APP至今無法為科大訊飛帶來營收和利潤。

目前,給訊飛帶來收入的業(yè)務有四大塊,分別是在線教育、企業(yè)智能客服、車聯(lián)網及運營商。其中,在線教育能帶來超過30%的收入,其他業(yè)務分別在20%上下。

在線教育,包括各種語言類在線考試,例如全國30省的全國普通話等級考試,唯一使用的操作系統(tǒng)就是科大訊飛。這一方面由于科大訊飛擁有業(yè)界較高水平的智能語音技術,另一方面具備中國科大背景、國家863計劃攻堅組核心成員的身份也起了直接作用。

劉慶峰認為,盡快占據手機端入口和電視端入口是當務之急,也是訊飛轉型的關鍵所在。今年8月,訊飛宣布進軍智能家居產業(yè),訊飛了面向智能家庭領域的系列語音產品,包括新版本語音助手靈犀3.0、以語音交互為特色的訊飛智能音箱、面向智能電視交互的“未來遙控”。

在規(guī)劃中,這是一場“從手控到聲控”的智能家居變革,通過發(fā)出語音指令實現開燈、調光,開關電視、空調等智能家電的動作,進而實現整個家庭的智能交互。

具體思路是,軟件和硬件雙管齊下,軟件方面,以電視機為切入口,首先與七家電視機廠商合作推出智能電視的“未來遙控”方案。硬件方面,則與中國移動聯(lián)合推出智能硬件產品――訊飛智能音箱,其賣點是實現語音、哼唱和原聲搜索“三合一”功能,背后依靠中國移動的無線音樂基地大量的正版音樂資源。

劉慶峰看上了移動互聯(lián)網入口帶來的大生意。為了用最快的速度占領智能語音市場,形成一個良性生態(tài)系統(tǒng),訊飛2010年語音云平臺,這個平臺的合作伙伴已超過4萬家,包括騰訊QQ、新浪微博、58同城、高德地圖等各類主流應用,支撐用戶數百萬級以上應用超過1000多個,終端用戶數量超5億。

國內最早進入智能家居行業(yè)的集成服務商Broadlink創(chuàng)始人劉宗孺在接受專業(yè)媒體采訪時認為,國內的智能家居目前大部分還只是噱頭,因為家電單品之間的智能標準尚未統(tǒng)一,無法互聯(lián)互通。

訊飛希望自己是這樣的一個連接者。也就是說,通過手機訊飛客戶端控制你家里的電視、空調和電燈。但在最近的一段時間里,你需要購買和訊飛合作的家電品牌的產品,且大多是幾個有限的型號。

劉慶峰對此并不悲觀,他預計,今年底語音聯(lián)盟的大會,就會有新的標準制定出來。

最終,訊飛不再是一個只為大公司提供語音解決方案為生的公司,而是一個以基于云計算的智能語音服務為切入口,成為一個語音平臺公司。

雖然人們普遍認可家庭娛樂中心將成為繼移動互聯(lián)網之后的又一個藍海產業(yè),但這個市場多年來始終沒有市場之王的候選人。從互聯(lián)網公司到IT公司再到傳統(tǒng)的家電廠商,涉足這個產業(yè)的公司既合縱連橫又分別競爭,一時顯得有些混亂。蘋果TV的遲遲不能問世,也在一定程度上說明了這個市場的不易和復雜性。

對于急于進入這個市場而又手握一定籌碼的科大訊飛來說,這是機會,也是風險。

劉慶峰的決策團隊意識到了這一點,在進入新的消費市場的同時,他并未放棄在現金牛市場的努力。最近,劉慶峰接待了多批教育市場的客戶。

科大訊飛在車聯(lián)網市場的領先優(yōu)勢繼續(xù)擴大。在德國奔馳汽車去年8月組織的一場車內智能語音比賽中,訊飛是唯一在時速100公里之上還可以使用的解決方案。這也直接促成了訊飛和奔馳的合作,并帶來了寶馬、沃爾沃、一汽、上汽、江淮和奇瑞的訂單。 可能的挑戰(zhàn)

劉慶峰承認,手機端的入口已經被谷歌和蘋果、百度和騰訊這樣的平臺型公司所占領,但他依然認為,還有三分之一的手機入口留給手機廠商和訊飛這樣擁有技術優(yōu)勢的公司。他想在這其中拿下最大一塊。

他的預期也比外界對智能語音的市場預期要樂觀很多。他說,15年前立下的年營收100億元目標,很有可能在未來幾年實現,但一些公開分析機構的預測是,這個市場在未來數年的總市場容量約為30億美元。

互聯(lián)網的成長速度十分迅速,9月底,中興通訊、Nuance、Audience、高德、百度、中國科學院自動化所等公司和機構宣布成立“智慧語音聯(lián)盟”,并了第一個中國智能語音技術規(guī)范標準“5A標準”。

這意味著,隨著智能語音技術前景的不斷放大,技術的快速成熟,科大訊飛面臨的潛在競爭對手正越來越多,這些單個語音實力遠不如訊飛的中外公司,正在抱團取暖。以前科大訊飛是摸著石頭過河,現在則是叢林中行走。

訊飛還要面臨技術門檻帶來的用戶教育成本。包括靈犀在內,任何一款語音識別軟件都需要大量的訓練以便識別用戶的語音特征,來提高準確性。但又有多少人會天天對著一臺手機喃喃自語呢?

更大的挑戰(zhàn)來自內部。吳曉如承認,訊飛從B2B走向B2C,不僅在產品研發(fā)管理、把握市場需求方面存在新挑戰(zhàn),業(yè)務模式也需要進行巨大變革。

在直面移動互聯(lián)網用戶之后,訊飛不僅需要加快產品迭代周期,用戶需求復雜度更是成幾何級增加,做到這兩點已經十分不易,更何況訊飛是一家技術研發(fā)型公司,2500人的總員工數中,超過1800人是技術工程師,渠道布局和市場營銷并非其所擅長。

第7篇:人臉識別的核心技術范文

“紅色光環(huán)”的誘惑力

從設計最本質的原則延展開來,我們會發(fā)現,任何不乏精致且充滿人文信念的物件,其鮮明特點的歸結總是有章可循。對于影像手機怎樣才能贏得大眾認可的問題,深諳設計之道的altek當然有著屬于自己的理解――用所有人習以為常的布局來營造“無差別”的拍攝樂趣,且這樣的樂趣正構筑在前文所說的“有章可循”之上。所以,A806手機上三處顯而易見的紅色光環(huán)就成為了引人注目的焦點。

純粹的紅:標準光學變焦鏡頭

毫無疑問,altek A806可謂經典又可稱平庸的直板機身造型,無法讓人以對手機充分審美的角度去留下深刻印象,所以,我們建議若是你只有匆匆一瞥的機會,請把目光放在它的機身背面。應該說,眼前這枚與便攜式DC沒有絲毫差別的鏡頭,對于我們常見的手機而言無疑是碩大的。但更重要的是,隱藏在已經足夠與眾不同的鏡頭之中的內容,它們才是數碼相機完整融入移動通訊終端的關鍵:1200萬像素CCD感光元件與雙核圖像處理器。

其實,在我們專業(yè)的角度看來,將這樣一套與便攜式DC無異的影像硬件配置到不足16mm厚的機身內并要保證移動通訊終端功能特點的順利運行,并非一件容易的事。因為從變焦鏡頭群組的收納機構到感光元件和處理器的功耗控制,都是設計者需要特別考慮的問題。不過,在數碼像機領域有著豐富經驗和核心技術的altek,已為A806準備了略顯保守但絕對可靠的方案――雖然沒有熱門的28mm廣角端,但35mm~105mm的焦段是長期以來短焦便攜式DC的通用配置,加之F3.0~F5.6的最大光圈,從景色合影到中焦段人像特寫,其涵蓋了大部分日常拍攝題材。

另外,在鏡頭旁我們也看到了氙氣閃光燈和輔助對焦燈的配置。就目前的主流影像手機配置趨勢來看,氙氣閃光燈和LED補光燈均有各自的存在理由:前者功率較大,且影閃曝光量均勻,對還原人像膚色作用明顯(這也是DC必然配備閃光燈的原因);后者功耗較低,適于手機,并能彌補閃光燈在暗光下無法為視頻拍攝提供長時間照明的缺憾(甚至包括手機用戶的日常照明需求)。A806之所以選配氙氣閃光燈,從這層意義上講,也是立足于“真正DC拍攝體驗”的考慮。當然,我們更欣賞如索尼愛立信Satio那樣二者兼而有之的方案。

專業(yè)的紅:標準電子快門

既然要對拍攝本身的樂趣有所要求,那么觸及快門的感覺就一定要納入考慮之中――毫不夸張地說,對快門感覺的要求,是一種于攝影人近乎癡迷般的“強迫癥”。在玩數碼單反相機的圈子里,某款機型的快門其聲其形(觸感),幾乎會影響到某些發(fā)燒友購買的傾向。A806畢竟還只是一款手機,故以前面話題來權衡,似乎對它有些過于吹毛求疵了,不過,若僅在影像手機的界限內,其快門則是值得一書的。A806明確的分段式電子快門手感,阻尼適中,與常用的DC沒有任何差別。可以大膽推測,altek應該是為A806配備了用于DC的快門機構,這對于一個數碼相機ODM龍頭企業(yè)而言是順理成章的事。在機身側面,同樣DC化的電子機構還包括攝/錄模式切換鍵和光學變焦鍵(兼通話時的音量調節(jié))

便利的紅:標準拍攝快捷鍵

有了標準的鏡頭與快門,A806離DC的距離已經很近,近到只剩那些眾多但又不可或缺的拍攝快捷鍵的設置了。畢竟,這只是一臺影像手機,我們在不斷地重申就是為了讓A806的設計靈感顯得更加難能可貴――當拍攝功能被啟動后,2、5、8、0等本來就寬大的數字鍵會啟動成為拍攝模式轉換熱鍵,在手機橫置的狀態(tài)下,我們的拇指能夠比較舒適地對它們進行調整,反饋力度不錯。而畫面回放與刪除鍵,也被設計在主鍵盤的區(qū)域之內,我們即便在待機狀態(tài)時亦可通過它們直接進入圖片瀏覽界面。同時,五維鍵也被賦予了影像瀏覽倍率切換和相機參數設定的功能。綜合而言,A806的操控感與DC是沒有明顯區(qū)別的。

在享有無差別的拍攝操控基礎之上,A806豐富的影像獲取能力可以得到更有效的發(fā)揮,例如“自拍精靈”模式,可以在將自己的面部完成對焦之后,發(fā)聲提醒,這遠比多數影像手機鏡頭旁那片小小的自拍鏡實用;又例如可以鎖定最多達10張面部的人臉識別功能,已完全屬于主流便攜式DC的水平。除此之外,微笑快門、智能防抖以及豐富強大的影像編輯功能,也讓我們獲得清晰的照片有了充足且人性化的理由。至于16張畫面的連拍功能與自動全景拍攝模式相結合,則是隨時留存美好回憶的保障。

早在2003年就有人預言影像手機將在5年內取代DC。今年初時,《新潮電子》曾說過,“這樣的預言者有其獨到的見解,卻也不盡然。因為不論是便攜式DC還是影像手機,由于傳感器尺寸小,提升像素并不能讓畫質更佳,繼續(xù)提升像素已經失去其意義。因此,影像手機和DC的像素在今后一段內必然會放緩增長腳步,功能上的多樣和豐富將成為他們今后的重點發(fā)展方向。如今,影像手機已經開始替代低端便攜式DC,但操控與成像離優(yōu)秀的便攜式DC還有相當距離……”。但此時面對altekA806所拍攝的照片,我們似乎又要走向論題的另一端:當前手機其實已經可以與優(yōu)秀的便攜式DC“零距離”,只是似乎技術以外的考慮局限了這類手機的進一步發(fā)展,如市場規(guī)劃,如成本要求,如跨行業(yè)協(xié)作。

回歸于手機

坦誠講,回歸于手機的本質,我們對A806的可談之處就并不那么多了。非智能平臺的A806,具備完善的通話和短信功能,支持Java MIDP 2.0程序。并且,除了影像拍攝的看家本領,其多媒體應用也是它不輸于人的強項。2.4英寸的26萬色TFT液晶屏,仍日使用OVGA分辨率,對于拍照取景和影像回放已然足夠,在播放自身所拍的640×480像素30fps視頻時,色彩及層次感也均屬主流水平。至于A806的UI界面設計,則是實用得有些傳統(tǒng)的列表式布局,對于見仁見智的審美問題,我們不作過多評判。另外,A806具備藍牙、USB2.0、TV-Out、Pict―Bridge等多種分享方式.這對于影像手機而言.重要性和必要性不言而寓。

理論上講.全面的影像配置A806在功耗方面并不讓人放心,好在1020mAh的電池能在正常使用負載下能為它提供約60小時的實際使用時間.已算表現上佳――而從另一個角度來講-它的獨立影像處理芯片看來也并非“電老虎”。

最熟悉的陌生

對于內地的用戶來說.altek(華晶科技)是一個相對陌生的企業(yè)-但它在中國臺灣卻是知名的頂尖企業(yè),它不但是全球數碼相機最大的ODM企業(yè),也曾經被評定為臺灣科技業(yè)一百強中的第三名。可以說,我們中的很多人,都使用過出自altek生產線的數碼相機。多年來,除專注于數碼相機的研發(fā)與制造,altek在應用面的諸多創(chuàng)新?更使得它已逐步成為專業(yè)的數碼影像專家。其實,在全球數碼相機ODM公司中,altek是惟一擁有自行研發(fā)影像處理芯片的公司,其生產的相機,均采用自行研發(fā)的影像心理芯片。另外,它與內地老牌光學企業(yè)鳳凰光學的入股合作,也促成了自身技術力量的均衡配置。所以,在進入移動通訊終端制造行業(yè)之后,altek也仍舊以影像手機的投入為主,這是其擅長的領域,自然力求有所建樹。

除了今天的主角A806之外,altek目前還有另一款更高端的1200萬像素手機T8680,它們的最大區(qū)別就在于,后者配備了尺寸更大的可觸控屏幕。

精選范文推薦