前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的人工智能醫(yī)療方向主題范文,僅供參考,歡迎閱讀并收藏。
雖然現(xiàn)在大家都把眼光盯上了谷歌AlphaGo對陣圍棋,可谷歌的心思卻并非在這里,下棋只是一場商業(yè)秀,實際上,在各種版本的公關宣傳中,谷歌已經非常明確的把未來人工智能的重點方向鎖定醫(yī)療。
對于醫(yī)療產業(yè)的巨大蛋糕,谷歌垂涎欲滴早已經不是一天兩天,谷歌在大數據上的應用最早也是從所謂的可以預測流行感冒這種傳染病而被社會所知。而且,社會上真正能讓谷歌手里所掌握的這種“人工智能”發(fā)揮作用的領域并不多,而醫(yī)療顯然是最合適的場所。
AlphaGo之所以可以和頂尖高手下棋,主要原因是全部吸收了人類棋手千年的成果和經驗,這都得益于保留和流傳下來的豐富棋譜,否則,巧婦難為無米之炊,AlphaGo根本就不可能會下棋。當然,下棋這個營生獲利太小,對于谷歌的吸引力一點都沒有,社會上的各行各業(yè)中,能夠保存基本完整且具有連續(xù)性資源可供機器進行學習的,醫(yī)療的病例最與棋譜類似。當然,病例要比棋譜還要復雜的多,非標準化的記錄也增加了很多麻煩,好在可驗證的機會比圍棋更多,操作的難度也應該適中。
在2007年微軟推出“健康庫”系統(tǒng),讓患者可以上傳病歷之后,谷歌也打造了谷歌健康(Google Health)平臺,讓患者通過互聯(lián)網,將自己的病歷、健康數據上傳到統(tǒng)一的網絡平臺,由自己管理,或選擇與醫(yī)生、朋友、家人共享。如此,谷歌已經收集和整理了大量的數據,為人工智能在醫(yī)療上的應用做足了功夫。
據報道,現(xiàn)在谷歌健康的合作伙伴已經包括各類研發(fā)機構、健康保險公司甚至醫(yī)藥零售商。谷歌通過與美國最大的藥品零售商CVS(Consumer Value Stores)合作,讓消費者將藥物服用數據上傳到谷歌健康系統(tǒng),從而輻射1億多美國人口,獲得這些患者的部分病史,這相當于美國總人口的1/3。
有專家認為,醫(yī)療歷來是技術驅動的重要代表。沒有聽診器的發(fā)明,醫(yī)生要用人耳靠在背上和胸前聽診;沒有CT磁共振的發(fā)明,骨科、內科、外科都沒法進展;沒有無菌術和手術器械的發(fā)明,很多疾病還是不治之癥;沒有很多重磅藥物發(fā)明,很多疾病必然素手無策。除了戰(zhàn)爭,醫(yī)療一直是應用最新科技的試驗場和推動力。
在互聯(lián)網改變醫(yī)療的發(fā)展途徑上,據說有七個方面,但實際就是兩種道路。一種是借助互聯(lián)網平臺的分享與眾籌能力,通過全社會的資源共享來研發(fā)新藥或新治療手段。比如,制藥巨頭葛蘭素史克(GlaxoSmithKline)公開了13500種化合物的數據,幫助開發(fā)抑制瘧原蟲的新藥物。葛蘭素史克希望通過分享信息,幫助科學家設計出一種治療效果更好的新藥物。這是制藥行業(yè)首次大規(guī)模應用開源開發(fā)模式到新藥開發(fā)上,志愿者通過通力合作可能創(chuàng)造新藥。另外一種,就是以谷歌為首的,使用網絡收集整理數據,提高自己人工智能水平,然后應用到藥品開發(fā)和治療手段的研發(fā)上。
可以預見,在未來,如果谷歌AlphaGo這樣的工具應用到中醫(yī)領域,這個依靠艱難的經驗積累才能獲得治療能力的古老行業(yè)也許會煥發(fā)青春,當流傳至今的千年驗方通過計算機的深度學習加以提煉吸收,也許會真的造就一位古往今來最牛的“神醫(yī)”,華佗就真的重生了。
像AlphaGo這樣的人工智能未來會幫助培訓醫(yī)生,輔助提高醫(yī)生的診療水平,大大減少誤診率,可以拯救數以百萬人的生命,甚至,未來可以是這樣的人工智能來操控手術刀進行復雜的手術,畢竟,人工智能沒有情緒和壓力,也不會疲勞,手術的風險會更小。實際上,這只是工廠里的制造機器人在醫(yī)療上的再造。
當然,未來的醫(yī)療,很可能需要人工智能、虛擬現(xiàn)實和3D打印結合起來,構筑成完美的現(xiàn)代化醫(yī)療科技體系。人工智能主導診療,虛擬現(xiàn)實負責心理治療和醫(yī)生的技術訓練,3D打印則在人工智能的指令下完成器官再造等治療方案。
所謂的第四次工業(yè)革命,一定要結出實際的革命成果。廣闊天地,誰能大有作為?
很多AI創(chuàng)業(yè)公司在各自的領域取得了突破,但具備強大的AI技術儲備,并且有能力滲透到幾乎所有領域的玩家,目前來看主要還是BAT三家。
這場AI“賦能”的戰(zhàn)爭,較量的是平臺、技術、場景、生態(tài)等多方面的綜合實力。百度喊All in AI,騰訊喊AI in All,阿里蓋起達摩院。
誰能在新革命中笑到山花爛漫?
短兵相接的前夜,我們繪制了一幅時局圖。
BAT時局
為了一爭高下,BAT下注或早或晚,但都離不開幾件事,例如組團隊、做研發(fā)、建生態(tài)等。
到現(xiàn)在,三大巨頭在人工智能上的布局已經能看出大致輪廓。
百度
百度在AI領域的野心,最初顯露于2013年1月,深度學習研究院(IDL)的創(chuàng)立。
后來李彥宏陸陸續(xù)續(xù)建成了五大實驗室,除了深度學習實驗室之外,還有硅谷人工智能實驗室、大數據實驗室、增強現(xiàn)實實驗室和深度學習及應用國家工程實驗室。
這些實驗室的研發(fā)成果歷經5年的整合,逐漸形成了一個平臺體系:百度智能云和百度大腦。智能云提供計算的基礎設施和數據的獲取、分析、標注能力,而百度大腦,整合了機器學習、深度學習算法,再將AI對語音、圖像、視頻、AR/VR的感知能力和自然語言處理、知識圖譜、用戶畫像等認知能力開放出來,就形成了百度AI開放平臺。
根據百度最新公布的數據,百度大腦現(xiàn)在擁有80多項核心AI能力,超過37萬名開發(fā)者和合作伙伴,每天被調用2.19億次。這些調用,來自百度內外。
對內,百度將AI能力輸送到百度現(xiàn)有的各個產品之中。主業(yè)搜索自不必說,從一開始就受惠于AI技術的進步,包括手機百度、愛奇藝等應用也在AI的驅動下不斷提升,2016年推出的信息流業(yè)務也在迅速發(fā)展。對外,百度走上開放平臺的道路,主推DuerOS和Apollo。
陸奇一年前降臨百度后,通過多種方式對業(yè)務進行了梳理和聚焦。核心當然就是上面兩個平臺,他們都各自成立了新的事業(yè)部進行支撐,當然也有醫(yī)療等業(yè)務被直接砍掉。
當然,百度在其他方面也一直有嘗試,比如金融、機場、新零售等場景下,百度也在不停地開拓,一步一步積聚力量,構建自己的下一個生態(tài)。
不過總體來說,無論是從“All in AI”的技術投入來看,還是從所有能力匯總于百度大腦、全力推進Apollo、DuerOS兩大平臺的布局來看,百度似乎在把自己的AI力量集中起來,向著最重要的行業(yè),單點突破。
最近陸奇在CES明確表示:“我們認為自己是一家旨在加快創(chuàng)新的AI公司,致力于實現(xiàn)AI技術的產品化和商業(yè)化。我想強調的是,最重要的是將該技術商業(yè)化,否則一切都是空談?!?/p>
阿里巴巴
眾所周知,馬云不喜歡“人工智能”這個說法,偏好機器智能。說辭的變化不影響本質。在整個互聯(lián)網行業(yè)涌向AI的浪潮中,阿里也在2017年推出“NASA計劃”和承載它的實體組織:達摩院。
達摩院的研究領域可謂廣撒網,涉及量子計算、機器學習、基礎算法、網絡安全、視覺計算、自然語言處理、人機自然交互、芯片技術、傳感器技術、嵌入式系統(tǒng)等,可以看出,AI在其中占據了半壁江山。達摩院的主要任務,是在全球范圍內建實驗室招攬人才,和高校建立合作。
實際上,阿里AI研究起步的遠遠早于達摩院,這家公司大部分AI基礎研究成果,出自2014年成立的數據科學與技術研究院,也就是iDST。
比如最近機器閱讀理解方面取得突破的阿里團隊,就來自iDST。當然阿里內部體系眾多,展開AI研究的部門也不少。例如在“雙十一”期間,商品推薦、客服、海報宣傳、運營維護等方面均有AI技術的加持。螞蟻金服也在與金融機構的合作中,把AI技術作為一個重要的亮點。
另外,不喜歡“人工智能”這個詞的阿里,還有一個以之為名的人工智能實驗室:A.I. Labs,它不止是一個研究機構,還承擔著基于AI技術打造平臺、推出產品的職責。目前,他們除了天貓精靈智能音箱和搭載的AliGenie操作系統(tǒng)、AliGenie語音開放平臺之外,還推出了AR開放平臺和AR內容平臺。
從2017年末開始,自動駕駛也成為了A.I. Labs發(fā)力的領域之一。
和自帶產品開發(fā)職責的A.I. Labs不同,iDST的研究成果走進現(xiàn)實世界,依靠的是他們打造的一個個“大腦”。這兩年來,阿里云相繼推出了ET城市大腦、ET醫(yī)療大腦、ET工業(yè)大腦、ET環(huán)境大腦、ET航空大腦,將AI能力與大數據和云計算結合起來,在各個垂直市場跑馬圈地。
阿里最近,在努力將這些大腦們整合為一個統(tǒng)一的平臺:阿里云ET大腦。2017年最后一場云棲大會上,ET大腦正式,所布局的領域也不再限于原本的城市管理、醫(yī)療、工業(yè)、環(huán)保、航空,同樣走上了“廣撒網”之路。
騰訊
騰訊無論做什么,都不會只投入一支團隊。在人工智能上也是一樣。
要論基礎研究,騰訊有AI Lab、優(yōu)圖實驗室和微信AI實驗室三大機構,優(yōu)圖專注于計算機視覺技術,而AI Lab和微信AI在研究方向上雖然叫法不同,但多有重合,都是AI實驗室標配的機器學習、自然語言處理、語音識別和計算機視覺。
根據各個實驗室列出的合作伙伴和案例,這些實驗室的技術,大部分都輸送到了騰訊各條產品線之中,成了微信里的語音轉文字、視頻音樂新聞的推薦和排序、QQ的高能舞室、天天P圖的軍裝照……
但是,就算產品體量龐大如鵝廠,也承載不完“AI in All”的野心。
騰訊的AI技術也同樣尋求著在更多垂直領域的落地應用,其中最引人注目的,是醫(yī)療平臺騰訊覓影。在金融、安防、政府政務、智慧零售等等領域,騰訊也都將AI技術與自身的社交、支付、地圖、小程序等等技術結合起來,推出了垂直解決方案。
另外,騰訊也有類似于百度大腦的“AI開放平臺”,在深耕的垂直領域之外,將自己的AI技能開放出來,供應給開發(fā)者。不過,目前這個“開放平臺”的用戶案例,依然是以騰訊內部產品為主。
在戰(zhàn)局最喧鬧的自動駕駛和對話式AI平臺上,騰訊也分別投入了不止一支團隊,開始造平臺、積累合作伙伴。
雖然騰訊進軍AI的時間較晚,但是能明顯感到動作和決心都很大。
重點戰(zhàn)場梳理
矛盾有主有次。
雖說廣闊天地大有作為,三家也各自有欽定的重點方向。但仍有一些是戰(zhàn)場是重中之重,也是未來BAT在人工智能技術落地的過程中,有可能最早展開廝殺之地。
對話式AI
人機交互的重大革新、下一代服務入口、下一個Android、家庭的控制中心……種種期待,讓用于智能設備的對話式AI成了BAT爭奪最激烈的領域。
百度有DuerOS,阿里有AliGenie,騰訊則至少有兩個:騰訊云小微和移動互聯(lián)網事業(yè)群(MIG)的叮當。
如果我們以智能音箱銷量來評判對話式AI系統(tǒng)的發(fā)展,很會做生意的阿里似乎沖在最前。2017年7月,阿里AI Labs初次亮相,了一款智能音箱:天貓精靈X1。這款音箱,雙十一降價促銷,當天賣出了100萬臺。
但是,賣音箱只是手段而非目的。天貓精靈背后的終極目標,還是一個關于AliGenie開放平臺、生態(tài)系統(tǒng)的夢想。
這個生態(tài)系統(tǒng)的夢想,BAT都有。
百度雖然直到去年底才推出渡鴉raven H智能音箱,但最新的數據顯示,DuerOS開放平臺半年時間里,已新增130余家合作伙伴,落地硬件解決方案超過20個,每月新增5款以上搭載DuerOS的設備,覆蓋家居、車載、移動各個場景,機頂盒、電視、冰箱、音箱、機器人、車載、手機、耳機等各類設備。
為了守住這個領域,百度除了在北京和硅谷建設AI龐大的團隊之外,還收購了兩家創(chuàng)業(yè)公司:做語音交互和自然語言理解的Kitt.ai,和后來推出了raven H音箱的渡鴉。
內部競爭還未分勝負的騰訊勢頭也很猛。公開亮過相的兩個團隊里,叮當的發(fā)展速度似乎更快一些。2017年4月,它作為一個“語音助手”以App的形態(tài),12月20日,了首款合作硬件1More耳機。截至目前,叮當雖然沒有推出名為“硬件開放平臺”的東西,但他們的“生態(tài)伙伴計劃”也的確很見成效,做機器人的優(yōu)必選、做音箱的哈曼、造車的廣汽、做手機的魅族、努比亞等二十多家硬件廠商,都在騰訊叮當的合作案例名單之上。
相比之下,騰訊云小微的硬件開放平臺和技能開放平臺仍處于內測狀態(tài),除了和華碩一起造的機器人之外,沒有太多關于合作伙伴的聲音傳出。值得一提的是,他們似乎在硬件之外,開辟了一條退路:智能客服。
智能音箱先行的AliGenie同樣不是天貓精靈專屬,它的硬件接入平臺頁面上,也展示著十多家合作伙伴。另外,AliGenie還推出了垂直行業(yè)智能語音解決方案,想在家居、移動硬件之外,為對話式AI開辟出新場景。
自動駕駛
2億輛汽車和200多家OEM車廠,勾畫出一個有更大想象空間的產業(yè)。
BAT在出行這件事兒上向來不安分,戰(zhàn)火從地圖、打車軟件一路燒到了自動駕駛。
如果我們將時間倒回一年之前,你可能會發(fā)現(xiàn),“自動駕駛”這個話題,幾乎還只有百度一家在談。而2017年過完,BAT已經悉數入局。最后一個傳出消息的,是阿里。
阿里的自動駕駛業(yè)務目前還處在招兵買馬階段。12月中旬開始,阿里官方網站上開始出現(xiàn)自動駕駛相關的人工智能實驗室(A.I. Labs)崗位,另外據36氪報道,這個團隊中有不少無人車創(chuàng)業(yè)公司nuTonomy的舊部,已經開始面向車廠做介紹。
在這之前,阿里和車廠的交集,都圍繞著互聯(lián)網汽車操作系統(tǒng)發(fā)生,最親密的盟友可能要數上汽。阿里和上汽合作打造的斑馬智行,已經推出了“全球首款互聯(lián)網汽車”榮威RX5。美國大廠福特、Tier 1供應商德爾福也是阿里的合作伙伴。除了這些合作伙伴之外,阿里還投資了一家國產電動汽車廠商:小鵬。
在投資車廠這件事上,出手最闊綽的當屬騰訊。除了先后入股創(chuàng)業(yè)公司蔚來和威馬,騰訊還在二級市場投資了特斯拉5%的股權,甚至秘密在硅谷投資了一家自動駕駛公司。
而騰訊本身的自動駕駛業(yè)務,據說已經到了全面研發(fā)、多次路測的階段。
在自動駕駛進展還不夠清晰的當下,騰訊的合作伙伴,也大多與AI in Car車聯(lián)網系統(tǒng)相關,廣汽、長安、吉利、比亞迪、東風柳汽、博世都和騰訊有著或多或少的聯(lián)系。
自動駕駛領域的領先者,其實已經被科技部點了名。2017年11月,科技部公布首批國家人工智能開放創(chuàng)新平臺名單,其中自動駕駛方面依托百度公司建設自動駕駛國家新一代人工智能開放創(chuàng)新平臺。
入局最早的百度,和阿里騰訊早已不在同一個發(fā)展階段。百度已經圍繞Apollo與博世、大陸、一汽、長安、奇瑞、北汽、金龍等90多家企業(yè)達成了合作,也探索出了一條清晰的路線——還是在這個領域打造一個Android。
Apollo,是百度2017年4月啟動的自動駕駛開放平臺,要為合作伙伴提供一個開放、完整、安全的軟件平臺,幫他們搭建完整的自動駕駛系統(tǒng)。到2018年初Apollo 2.0的,云端服務平臺、軟件平臺、硬件平臺、車輛平臺在內的四大模塊全部開放,釋放了在簡單城市道路上自動駕駛的能力。一切,都按照去年7月公布的路線圖進行著。
按計劃,2018-2020年,百度會加快開放速度,直到最后能讓合作伙伴完成完全自動駕駛。
但對于Apollo來說,更重要的還是生態(tài)。所謂生態(tài),不僅僅是被賦能的車廠,Apollo還為向產業(yè)鏈上下游延伸而建立了基金,要在未來3年投出100多個項目。作為一個開源系統(tǒng),創(chuàng)業(yè)公司、高校實驗室同樣是Apollo的伙伴。
和騰訊一樣,百度也投資了威馬汽車,也投資了共享出行平臺首汽約車。此前百度還投資了自動駕駛關鍵部件激光雷達的核心廠家Velodyne,相關技術開放商xPerception等。
金融
還有一個不可忽略的戰(zhàn)場,是金融。
阿里旗下的金融巨頭螞蟻金服和阿里云都在嘗試賦能金融機構。
2017年1月以來,螞蟻金服開始逐漸轉變自己的定位,嘗試用自身積累的技術能力來賦能、服務金融機構。夏天,螞蟻金服在理財和保險領域,向金融機構開放了“理解用戶”、“優(yōu)化投資策略”和“用戶與金融產品匹配”三個層面的能力,后來,AI客服能力、智能圖像定損技術等等也相繼開放。然而這還并不是螞蟻金服AI布局的全貌,首席數據科學家漆遠說:“螞蟻AI技術將成熟一個,開放一個?!?/p>
2017年底,阿里云又了ET金融大腦,要幫合作伙伴風控、營銷和客服方面提高效率。
相比之下,騰訊向金融行業(yè)合作伙伴提供的技術就顯得比較表面,沒有涉及風控這樣的專業(yè)垂直應用,而只是將更為通用的身份檢測、客服等能力注入其中。
你可能想不到,百度,也是這個戰(zhàn)場上的一個重要玩家。雖然百度金融這一年來在to C市場上聲量不大,但這家“All in AI”的公司,在金融上也要將“智能化”堅持到底。
在11月的百度世界大會上,百度金融技術負責人許東亮說,百度金融已經賦能近400家機構,為機構客戶提供解決方案,為它們提供安全防護、智能獲客、大數據風控等服務。
百度金融據說還在謀劃更為獨立的未來。
醫(yī)療
要說AI在各行各業(yè)的應用,不少人都會第一個想到醫(yī)療影像。
在這個領域,百度在醫(yī)療事業(yè)部部分團隊轉入AI體系之后就悄無聲息,但騰訊和阿里都在搶占布局。
首批國家新一代人工智能開放創(chuàng)新平臺中,騰訊就以醫(yī)療影像平臺“覓影”入選。騰訊覓影于2017年8月,最先推出的是早期食管癌篩查。后來,覓影又相繼推出早期肺癌篩查、糖尿病性視網膜病變篩查、乳腺癌早期篩查等醫(yī)療影像技術,還基于自然語言處理推出了AI輔助診療、病案智能化管理產品。
騰訊覓影結合了AI lab、騰訊優(yōu)圖、TEG架構平臺部等團隊的AI技術,由互聯(lián)網+合作事業(yè)部牽頭建立。推出至今不到半年,騰訊覓影已經有了西門子醫(yī)療、蘭州大學第二醫(yī)院、深圳市南山人民醫(yī)院、中山醫(yī)院等十幾家合作伙伴。
馬化騰此前表示,醫(yī)療與AI是非常好的落腳點,未來騰訊在醫(yī)療方面會做更多的事情。
阿里入局AI醫(yī)療其實比騰訊還要早。2017年3月底,ET醫(yī)療大腦首次亮相,宣稱具有虛擬助理、醫(yī)學影像、精準醫(yī)療、藥效挖掘、新藥研發(fā)、健康管理等功能。
與騰訊思路不同的是,ET醫(yī)療大腦的技術并非都出自阿里內部,而是聚集了不少合作伙伴一起提供服務,比如做皮膚檢測的宜遠智能、分析病歷的惠每醫(yī)療等等。
目前的阿里云ET醫(yī)療大腦,能夠提供影像智能診斷、智能病歷診斷、語音醫(yī)囑錄入、醫(yī)療意圖識別、輔助管理決策、家庭慢病管理、DNA序列分析等功能。阿里在醫(yī)療方面,還跟華大基因、上海華山醫(yī)院、浙江衛(wèi)計委等機構展開合作。
另外,阿里去年也在醫(yī)療方面有一些投資布局,包括嘉和美康、Prenetics等。騰訊的動作也不少,去年已經披露出來的醫(yī)療相關投資包括:VoxelCloud、Grail、企鵝醫(yī)生、Practo等。
零售
不管是新零售還是舊零售,不管是線上還是線下,阿里在這個領域都有天然的優(yōu)勢。
先梳理一下AI給阿里自身業(yè)務帶來的變化。機器人客服“阿里小蜜”,雙11當天承擔95%客服咨詢;機器智能推薦系統(tǒng),雙11當天產生567億不同的貨架;AI設計師“魯班”,雙11期間,設計4.1億張商品海報;華北數據中心運維機器人:接替運維人員30%重復性工作……
與AI之于百度的搜索業(yè)務一樣,AI之于阿里的電商業(yè)務也具備天然的賦能加成。除了上面提及的進展,螞蟻金服還基于AI技術推出客服機器人“小螞答”,以及AI助力的車輛定損服務“定損寶”等。
阿里還搞出了無人零售咖啡店。無人商店,是一個未來非常有意思的趨勢。
此外,阿里在新零售思想的指引下,還大舉投資了一批線下零售相關企業(yè),包括:企加云、大潤發(fā)、東方股份、新華都、易果生鮮、銀泰、bigbasket、聯(lián)華超市……
可以想見,阿里在零售方面的生態(tài)布局,一定會成為其AI技術應用的重要場景。
零售不是騰訊的強項,不過騰訊也提出了“智慧零售”的概念。騰訊COO任宇昕對此解釋稱:騰訊希望的是通過’去中心化’的方式,把平臺能力開放給廣大品牌商、零售商以及商業(yè)地產等合作伙伴。
騰訊表示將提供場景、大數據、AI技術支持,以及騰訊全產品線,幫助商家量身定做解決方案,幫助線下門店實現(xiàn)數據化和智能化,讓消費者與商品之間,實現(xiàn)跨場景的智慧連接。
這些前后端的人工智能技術在應用又可分為四類:語音識別、圖像識別、自然語言處理和用戶畫像。那么在這四類具體應用的實現(xiàn)上AI技術給我們生活帶來哪些便利,同時存在哪些局限?下面一一來解構:
一、語音識別
語音識別
語音識別有兩個技術方向,一個是語音的識別,另一個是語音的合成。
語音識別是指我們自然發(fā)出的聲音需要機器轉換成語言符號,通過識別和理解過程把語音信號轉變?yōu)轫憫奈谋净蛎?,然后再與我們交互。語音識別技術可以應用在電話銷售上,例如:公司新人特別多,沒有經驗,拿到單子的可能性很低。怎么才能讓新人也能有很優(yōu)秀的銷售能力呢?過去的做法是,把經驗總結成冊子,讓新人去背,很容易就忘了。但如果有了高精度的語音識別能力,就能識別出客戶在問什么,然后在屏幕上告訴新人,該怎么回答這個問題。
語音識別的第二個方向是語音的合成,是指機器把文字轉換成語音,并且能夠根據個人需求定制語音,然后念出來。以前的聲音是那種勻速的、沒有語調起伏的機器聲音,現(xiàn)在能用比較自然的人聲。語音合成能模擬任何一個你喜歡的人的說話方式,可以做到每個人聽的東西都不一樣。我們駕車經常使用的百度導航里李彥宏的聲音就是語音合成的結果。
盡管深度學習被引入語音識別后,識別率迅速提升到95%,但要將ASR(自動語音識別)從僅在大部分時間適用于一部分人發(fā)展到在任何時候適用于任何人,仍然是不現(xiàn)實的。一個無法突破的問題就是語義錯誤。例如:生活在南京的人都知道有個地方叫卡子門(kazimen),但是百度導航在理解卡子門的時候,會分詞為:“卡子-門”,結果卡子門(kazimen)就被讀成了卡子門(qiazimen)。
二、圖像識別
計算機視覺
圖像識別就是我們常說的計算機視覺(CV)。常用在:印刷文字識別、人臉識別、五官定位、人臉對比與驗證、人臉檢索、圖片標簽、身份證光學字符識別(OCR)、名片OCR識別等領域。
人類認識了解世界的信息中大部分來自視覺,同樣,計算機視覺也成了機器認知世界的基礎,其終極目的就是讓計算機能像人一樣“看懂世界”。目前計算機視覺在人臉識別、圖像識別、增強現(xiàn)實等方面有很好的應用,但也存在一定的挑戰(zhàn)。我們就拿谷歌的無人駕駛來說,通過機器視覺識別的技術路徑在現(xiàn)階段,仍有完全無法逾越的技術難題。
不談算法,圖像的攝取精度就是難關,即使最頂級的攝像設備都無法達到人眼的細節(jié)獲取能力,看看最頂級的哈蘇相機配合最頂級鏡頭,在夜晚街頭短曝光時間下拍的照片,對比人眼看到的圖像就能看到差異,這還不談經濟上可行的低成本攝像設備,視覺識別自動駕駛這個系統(tǒng),眼睛就是近視眼。
而且如果下雨,灰塵等對分辨的影響都是很難解決的bug。如果配合雷達的話又有邏輯判斷優(yōu)先的問題,信攝像頭,還是信雷達?會不會誤報?而作為激光雷達,如果單純的車身自己也有同樣的邏輯判斷的問題,什么樣的東西是有威脅的,什么是無威脅的。什么是潛在的威脅,這都不是計算機視覺這種單一智能所能解決的。因為預測未來的感知能力,是人與機器最大的區(qū)別。
三、自然語言處理(NLP)
賢二機器僧
自然語言是人類智慧的結晶。自然語言處理(NLP)是人工智能中最為困難的問題之一。由于理解自然語言,需要關于外在世界的廣泛知識以及運用操作這些知識的能力,自然語言認知,同時也被視為一個人工智能完備(AI-complete)的問題。
舉個例子,我們以前用鍵盤,鼠標,觸摸屏去和設備互動。但是現(xiàn)在你操作設備,只需沖著智能音箱說:請給我的手機充值100元即可。雖然這種功能在阿里的天貓精靈上已經實現(xiàn)了,但實現(xiàn)的前提是天貓精靈APP上已經錄有你的聲紋,并且你的手機號碼,及支付密碼已經預先在APP端設置好,否則機器沒有辦法理解我是誰、給誰的手機充值100元話費。
其次,自然語言處理背后所依賴的是傳統(tǒng)的問答系統(tǒng)技術,即Question Answering(QA)。QA技術是自然語言處理中非常重要的一個研究方向,原理是:對于輸入的問題首先做句法分析,從而理解問題或者指令的結構和意圖。比如如果用戶問的問題是某人出生在哪兒,那么機器需要先對這句話進行解析,進而了解所要回答的應當是一個地點,并且這個地點應當滿足某人出生與此的條件。
當我們能夠準確地了解到用戶提問的意圖并能根據機器可以理解的方式重新組織之后,就需要尋找答案。為了實現(xiàn)這一目的,QA系統(tǒng)的背后都存在一個龐大的數據庫(也就是知識庫),這個數據庫中存儲著所有的指令對應的行為或者問題對應的答案,當系統(tǒng)在數據庫中搜索到了自己要做什么或者回答什么的時候,就可以將答案反饋給用戶,或者直接實現(xiàn)用戶的指令。當然,如果數據庫的規(guī)模實在有限,有一個兜底的方法就是基于信息檢索來返回答案,即將用戶的輸入提取出關鍵詞然后求助于搜索引擎返回相關的內容再返回給用戶,由于互聯(lián)網無所不包,因此結果一般也尚可接受。
自然語言處理這塊相關落地的產品就很多啦。典型的代表就是聊天機器人,其中一類是以Siri、Amazon Echo、微軟小娜、阿里天貓精靈、小米小AI音箱等為代表,偏向于工具性的服務型機器人。另一類則是以微軟小冰為代表的娛樂型機器人。第一類聊天機器人,以完成任務或回答事實性問題為導向,譬如你問天貓精靈“今天的天氣如何?”,或者給“小愛同學”下達“關閉臥室臺燈”等指令。第二類則以閑聊為導向,并不需要給出某一個事實性問題的解答,只要交談自如、博君一笑即可。比如:北京龍泉寺的賢二機器僧。
四、用戶畫像
碟中諜6:全面瓦解
用戶畫像是根據用戶社會屬性、生活習慣和消費行為等信息/數據而抽象出的一個標簽化的用戶模型。構建用戶畫像的核心工作即是給用戶貼“標簽”——用數據來描述人的行為和特征,而標簽是通過對用戶信息分析而來的高度簡練的特征標識。
用戶畫像在商業(yè)領域應用的非常廣泛。拿百度舉例。百度現(xiàn)在識別了將近10億用戶,用了幾千萬個細分標簽給用戶分類,比如性別、年齡、地理位置,還有這個人在金融領域的情況,在旅游方面有什么愛好等等。這些東西合在一起,就組成了用戶畫像。百度就知道你是什么樣的人,喜歡什么樣的東西。比如,今年暑期檔將要上映的電影《碟中諜6:全面瓦解》,在宣傳的時候把人群分成了三類,一類是不管怎樣都要看的,一類是不管怎么都不會看的,第三類是可能會進電影院的。宣傳方就會使用百度大腦的用戶畫像功能,識別出第三類人群,對這類觀眾進行定向宣傳。
人工智能在用戶畫像里最重要的作用就是找到相關性,給用戶打標簽。用戶標簽是表達人的基本屬性、行為傾向、興趣偏好等某一個維度的數據標識,它是一種相關性很強的關鍵字,可以簡潔的描述和分類人群。比如好人和壞人、90后80后,星座、白領等。具體流程一般是從紛亂復雜、瑣碎的用戶行為流(日志)中挖掘用戶在一段時間內比較穩(wěn)定的特征,即給用戶打上標簽。
舉例來說,如果你經常購買一些紙尿褲,那么電商網站即可根據母嬰購買的情況替你打上標簽“有孩子”,甚至還可以判斷出你孩子大概的年齡,貼上“有1-4歲的孩子”這樣更為具體的標簽,而這些所有給你貼的標簽組,就成了你的用戶畫像,也可以說用戶畫像就是判斷一個人是什么樣的人。但是今天的人工智能雖然能夠找到相關性,但是卻無法找到內在的邏輯,因此容易把前提和結論搞反了。比如根據大數據的統(tǒng)計,喝咖啡的人比不喝咖啡的人長壽。但大數據沒告訴大家喝咖啡是不是原因,或許是生活水平高的人才有錢、有時間喝咖啡。所以真實的情況是長壽的人喝咖啡。
五、人工智能算法
深度學習算法
說完了語音識別、圖像識別和自然語言處理這些涉及交互的前端人工智能技術, 我們再來說說后端人工智能技術。后端的人工智能技術指的就是人工智能的核心算法,包括深度學習算法、記憶預測模型算法等。
首先,我們來說說深度學習算法。我們知道2016年是人工智能爆發(fā)的一年,先有AlphaGo戰(zhàn)勝李世石,到了年底又有Master連勝60場,橫掃中日韓圍棋高手,一時間輿論為之震驚。這個Alpha Go背后的DeepMind團隊,用的就是深度增強式學習,這是深層神經網絡用于決策領域的成果。深度學習是機器學習的一個新領域,普遍認為深度學習的開創(chuàng)者是加拿大多倫多大學一位叫Geoffrey Hinton的教授,他是一位“神經科學家+計算機科學家”,他認為大腦是用全息的方式存儲外界世界信息的,并且從上世紀80年代就開始研究用計算機系統(tǒng)架構來模擬人類大腦,就是我們今天說的深度學習的原型。
今天我們可以這樣理解深度學習算法,深度學習就是運用神經網絡一層又一層的計算來找到最優(yōu)的參數,再結合參數去做出未來的決定。出發(fā)點在于建立、模擬人腦進行分析學習的神經網絡。深度學習的整個學習過程中,幾乎可以做到直接把海量數據投放到算法中,讓數據自己說話,系統(tǒng)會自動從數據中學習。從輸入到輸出是一個完全自動的過程。深度學習算法現(xiàn)在被設計成實現(xiàn)設計者既定目標的工具。比如,AlphaGo的目標就是去贏得圍棋比賽,而不是去開車或干其他事情。AlphaGo不能自己設定自己的目標,如果要完成另一個目標,就需要設計另一種機器。當然人工智能有N多條路,深度學習算法是目前人工智能算法里表現(xiàn)最好的。但深度學習并不是一上來就好的,讓深度學習崛起還有兩個華人:
一個就是斯坦福的教授,也是后來谷歌大腦的創(chuàng)始人吳恩達教授,因為他發(fā)現(xiàn)深度學習需要有更強的計算能力,所以他找到了英偉達的GPU(Graphics Processing Unit,圖形處理單元),使得計算能力提升了上百倍。
另外一個人也是斯坦福的教授李飛飛,她建立了一個圖像識別資料庫。而且這個庫里面的所有的圖像都是標注過的,也就是說,如果圖里有山就會標注出山,如果有樹就標注出樹。這樣的話,你可以用這個圖形庫來訓練人工智能系統(tǒng),看它能不能識別出來這個圖形庫上面所標注的這些元素。經過這個圖像庫的訓練,就可以訓練出視覺能力超過人的人工智能系統(tǒng)。
但是千萬不要以為深度學習達到今天的水平就是無敵了,甚至可以超越人類了。深度學習發(fā)展起來的人工智能系統(tǒng)存在一個明顯的缺陷,就是他的過程無法描述,機器不能用人的語言說出來它是怎么做到的。例如,Alpha Go打敗了李世石,你要問AlphaGo是為什么走這步棋,它是答不上來的。也就是說,我們沒辦法知道機器做事情的動機和理由。
要想更好的認識到人工智能算法的局限性,需要引入一個概念,就是認知復雜度。什么是認知復雜度呢?就是指你建構“客觀”世界的能力。認知復雜度高的人,善于同時用互補,或者互不相容的概念來理解客觀世界,因為真實世界本身就不是非黑即白的。那么對于機器來說,“認知計算”和“人工智能”有啥關系呢?人工智能的未來一般被分為三個發(fā)展方向:人搞定機器、機器搞定人和“人機共生”。而以“人機共生”為目標的人工智能,就是認知計算。IBM在認知計算領域獲得了大量經驗,并且總結了認知計算的三個能力,分別是交流、決策,和發(fā)現(xiàn)。
(1)交流
第一個能力是交流,認知計算可以處理非結構性的問題。很多用Siri的人,只會把這當成娛樂功能,因為它不能保證交流內容的準確性,有時Siri根本接不上你的話,因為你的話對它來說太復雜了。這個只能算作人工智能比較初始的狀態(tài)。
而認知計算可以完全模仿人類的認知,你可以把它當做一個孩子。就好像孩子周圍有一群逗他玩的大人,有人告訴孩子1+1=2,也有人說1+1=3。但是隨著孩子的成長,他自己會明白1+1=2才是對的。這就是非結構性問題。早期的人工智能只能學會別人教給他的知識,但是認知計算可以處理模糊的,甚至是自相矛盾的信息。
(2)決策
第二個能力是決策,我們都知道人工智能可以分析復雜的邏輯,然后做出決策。認知計算可以更進一步,根據新的信息來調整自己的決策。更厲害的是,認知系統(tǒng)所做的決策是沒有偏見的,而“毫無偏見的決策”對人類來說幾乎是一件不可能的事。比如說治療癌癥,這是典型的醫(yī)療決策場景。
癌癥之所以難治,一方面由于這種疾病太過復雜,另一方面,醫(yī)生如果不能及時發(fā)現(xiàn)患者的癌癥信號,可能會延誤患者的治療,或者導致診斷錯誤。而認知計算可以綜合分析復雜的醫(yī)療數據,還可以在醫(yī)生語言的上下文中解析含義,最后提出它的建議。
這就大大減少了醫(yī)生查病歷的時間,讓醫(yī)生能將更多的時間用在患者身上。2016年8月,《東京新聞》報道說,IBM研發(fā)的認知計算機器人“沃森”,就學習了海量的醫(yī)學論文,只用了10分鐘,就為一名患者診斷出了很難判斷的白血病類型,還向東京大學醫(yī)科學研究所提出了適當的治療方案。
(3)發(fā)現(xiàn)
第三個能力是發(fā)現(xiàn),認知計算能發(fā)現(xiàn)新事物和新連接,填補人類思維的空白。比如在競爭激烈的餐飲業(yè),怎樣才能做出令顧客滿意的新菜品呢?
認知系統(tǒng)可以整合區(qū)域知識、文化知識,還有各種食物搭配理論,幫助用戶發(fā)現(xiàn)想象不到的美食搭配。比如突然有一天,它會告訴你:用鹵煮的配方做個披薩,可能很合你的胃口。你照著一做,發(fā)現(xiàn)還不錯!實際上,從2015年開始,IBM開發(fā)的“沃森大廚”,就已經學習了35000多種經典食譜,然后通過分析海量的食材搭配,結合化學、營養(yǎng)學等方面數據,為廚師和美食家?guī)砹顺鋈祟愊胂蟮男滦褪匙V。
認知計算可以幫助我們更好的交流、決策和發(fā)現(xiàn)。但是人工智能依然有很多做不到的。例如:抽象能力,自我意識,審美,情感等。
這不是現(xiàn)在它自己就可以作出的決定—注意,我說的是現(xiàn)在。至于以后,這會是一個更重大的話題。
我們可以先從它怎樣為IBM帶去新生意談起。接受《第一財經周刊》采訪的沃森商業(yè)化主管Manoj Saxena最近透露說,IBM的相關規(guī)劃已經制訂到了2015年。而到了那一年,“包括沃森項目在內的IBM數據分析業(yè)務收入將超過160億美元?!?/p>
這不算一個小數目,它看起來比深藍要厲害多了。要知道因為擊敗了國際象棋冠軍,深藍也曾經名噪一時,但它最終只是成為了IBM每年公司折舊費用上的一部分數字。
很大程度上,這是因為沃森站在了深藍的肩膀上。
2011年2月16日晚,在超過3500萬名觀眾面前,沃森在美國著名的智力競賽節(jié)目《危機邊緣(Jeopardy)》中,擊敗曾連續(xù)74次奪冠的Ken Jennings和另一位選手Brad Rutter,拿走了100萬美元獎金。后來Ken Jennings在他的題板上寫下了那句被人們所熟知的話:“嗨,電腦們?,F(xiàn)在,我們的新老大來了!”
他是被這樣一臺東西擊敗的:它有一塊方型顯示屏,還有90臺IBM POWER 750處理器—其中包括2880個CPU,還有15TB的內存。這些都被藏在演播室上方的機房里。
IBM大中華區(qū)Power服務器產品部總經理侯淼解釋說,這樣的配置可以讓沃森每秒進行80TB的浮點運算。這相當于每秒閱讀100萬本書籍,而它身邊的Ken和Brad可能一輩子也讀不完其中的1%。
類似這樣的超強運算能力深藍其實也具備,并且也正是依靠這種能力,它才可以每秒分析2億步棋,最終戰(zhàn)勝了卡斯帕羅夫。但如果要讓深藍參加智力競賽,它可能一題也答不上來,甚至連問題也無法理解。
這正是沃森的強大之處:它可以理解人們所說的話,并快速做出反饋。這個被稱為“頭腦”的部分,是IBM為沃森研發(fā)的深度問題回答(Deep QA)技術。
再通俗點說,這是人工智能(AI)的真正開始。
舉個例子的話,當沃森被問到“哪個城市在2008年舉辦了一項標志為‘五環(huán)’的重要賽事”時,它的整個處理過程是這樣的:第一步,根據語法,找到“問題焦點”并進行標注,在這一題中,“城市”就是問題焦點;第二步,它會對“2008年”、“標志”、“五環(huán)”、“重要賽事”等關鍵詞,按照不同權重進行知識庫搜索,從中抽取初始答案;第三步,將這些初始答案—常常是成百上千個模糊答案,重新帶回到問題中;最后一步,也是最關鍵的一步,沃森通過一個學習模型,綜合搜索信息,對所有答案按照概率排序,將它認為可能性最大(概率最高)的三個答案顯示到答題板上。整個過程都發(fā)生在幾秒中之間。
IBM在全球擁有12個研究院,每年會投入60至70億美元進行研發(fā)?!坝幸活愌邪l(fā)公司內部稱為Grand challenge?!焙铐嫡f:“一旦研發(fā)成功,將會對整個社會產生非常巨大的影響。”
2000年初,時任IBM總裁的彭明盛第一次對研發(fā)部門提出了“Grand challenge”的目標,希望到2011年也就是IBM誕生100年時,能夠研發(fā)出一款革命性的產品,影響整個計算機行業(yè)未來的走向,甚至能夠對人類有非常巨大的幫助。
4年之后的一天,IBM研究經理Charles Lickel在一家餐廳里和同事吃飯,突然之間,整個餐廳安靜了。他發(fā)現(xiàn)所有人的目光都集中在了大屏幕上,期待Ken Jennings擴大他在《危機邊緣》節(jié)目中的連勝記錄。
這個情景讓Charles Lickel產生了一個想法:讓IBM開發(fā)一款答題機器。這個想法很快得到了上層的支持。IBM語意分析與綜合部接下了這個最具挑戰(zhàn)性的項目,從2006年開始進行了一系列測試。
在最初的測試中,研究人員向沃森提了500個《危機邊緣》中出現(xiàn)過的問題,沃森只能答對15%左右的問題,而節(jié)目中最好的選手,可以用比沃森少一半的時間答對其中95%以上的問題;從2007年開始,IBM給這一項目加派了15個研究人員,希望通過3至5年的時間把沃森訓練成一架優(yōu)秀的答題機器。
在此過程中,沃森進行了55次模似競賽,這些比賽完全按照《危機邊緣》的賽制,邀請節(jié)目中的冠軍們和沃森進行比拼。當沃森答錯一題時,沃森會對錯誤答案進行記憶,當下一次碰到同類型問題時,將對原有的答題邏輯進行優(yōu)化,避免再犯同樣的錯誤。這跟人類的自我改正十分相似。
在整個訓練過程中,沃森逐漸取得了70%的勝率。到了2011年比賽前的最后幾個月,沃森幾乎可以擊敗所有的選手,它準備好了。
除了強大的計算能力和海量的數據來源,研究人員為沃森設計的自我記憶、糾錯、學習的模型,成為沃森不同于其他超級計算機的關鍵。這樣的“學習模型”,也出現(xiàn)在Google無人駕駛汽車的研發(fā)中:技術人員每天帶著電腦上路,讓它記憶人類在駕駛汽車的過程中,面對不同情況時的應對方法。
不同的學習模型可以造就不同的沃森,這也是IBM在考慮沃森的商業(yè)化方向時,需要面對的問題:沃森到底是什么、它應該解決什么問題。
在IBM的官方網站上,對沃森的介紹是“集高級自然語言處理、信息檢索、知識表示、自動推理、機器學習等開放式問答技術的應用”,但這樣一個文縐縐的解釋,很難說服那些目標客戶。這些客戶通常只在乎自己的錢花在了哪兒、沃森能為他們做什么。
IBM資深副總裁和研究主管John Kelly在接受媒體采訪時曾表示:“我們真的認為它可以用在任何地方。”同時他和他的同事也清楚地認識到沃森真正的“基因”:它可以在很短的時間內處理海量的信息,并從這些信息中找出有價值的部分,通過自然語言同人類實現(xiàn)信息的交流和交換。
這讓沃森可以成為一個“智囊”、“顧問”和“助手”。那些需要處理大量數據、知識不斷更新,同時又需要據此做出復雜判斷的領域,成為了最能發(fā)揮沃森作用的領域。
沃森在醫(yī)療行業(yè)找到了自己的第一份工作。根據IBM和醫(yī)療保險公司Wellpoint的協(xié)議,從2012年年初開始,沃森將幫助護士們管理復雜的病例和來自醫(yī)療服務提供商的請求;然后,Wellpoint會開發(fā)一套面向醫(yī)生的技術,使得醫(yī)生可以通過自己的手機和平板電腦,了解腫瘤患者的身體狀況。
侯淼說,選擇醫(yī)療領域是因為這里具有良好的檔案儲存制度,積累了大量的醫(yī)學數據、病歷檔案,并進行了科學的分類。這些大量的可搜索數據,是沃森發(fā)揮作用的重要前提。
不同地區(qū)醫(yī)療水平的巨大差異,也使得沃森擁有廣泛的應用前景?!耙恍┢h地區(qū)的小醫(yī)院也可以通過云端訪問全國的醫(yī)療數據庫,享受到沃森帶來的服務。”
Mark Kris所在的Memorial Sloan-Kettering癌癥研究中心(MSKCC)在1年前加入了這一項目。Kris是一位經驗豐富的臨床腫瘤醫(yī)師,同時也是《危機邊緣》的忠實粉絲。他告訴《第一財經周刊》,從2年前他在電視機前目睹沃森表演的那天起,就對沃森產生了興趣。
過去半個世紀,人類在許多領域取得了突破性的進展,但癌癥研究和臨床治療方面一直沒有重大突破。按照Kris說法,在過去40年中,癌癥研究方面最大的突破,僅僅就是讓人類了解到了這種疾病的復雜性。
在癌癥治療領域,不同病人之間有十分微妙的差異,醫(yī)生們需要有更好的方法了解和區(qū)分這些差異,因為這些小差異帶來的影響,有時候可能是致命的。
無法準確知道這些差異的結果,就使醫(yī)生無法針對每個人不同的病情確定最佳治療方法?!盎熓浅R姷囊环N治療方法,”Kris解釋道,“但是你怎么在數十種不同的化療選項中進行挑選呢?你又如何確定劑量?怎樣的化療頻率才是最佳的呢?”
在現(xiàn)在這個階段,沃森還不能馬上成為這個救世主。它眼下的主要工作,還是通過搜索醫(yī)學文獻和歷史數據,快速為某一患者找到情況相似的其他患者。這一過程可以幫助醫(yī)生在相似案例間獲得更多的有用信息,在信息更充分的條件下做出更有說服力的判斷。在沃森之前,醫(yī)生需要自己熟記每一個病人的情況,還要在新病人出現(xiàn)時立刻從頭腦里搜索出相似對象,費時費力,準確性還不高。
在進入Memorial Sloan-Kettering癌癥研究中心之后,“補課”是沃森要做的第一件事,MSKCC的員工和IBM的項目成員一起訓練著沃森。從肺癌開始,研究人員通過分享關于肺癌的知識和經驗,讓沃森了解到所有關于肺癌的內容。
沃森沿用了它在參加《危機邊緣》訓練時建立的學習模型:它的所有答案最終都會以一個概率的形式出現(xiàn),那個概率最高的答案,就是沃森認為的正確答案;當這個答案被證明錯誤時,沃森會找到它與正確答案之間的區(qū)別,以后再遇到同類問題時,就會更新原有的邏輯;另外,它還可以從其他選手回答的同一類型問題中歸納出答案特點,幫助它用來回答這類問題。
在經過6個月的培訓以后,沃森成為了一名可靠的醫(yī)療助手。醫(yī)生們在自己的平板設備中打開沃森的應用,錄入數據并提出問題。幾秒鐘之后,沃森就會提供幾個可能的治療方法,并且以不同的數值表示確信程度。有的治療方法有90%的確信度,有的則是80%。而選擇哪種治療方式,還需要醫(yī)生最后拿主意。
2013年秋天,Kris將和他的同事一起利用沃森幫助真正的病人進行癌癥治療。IBM在前不久聯(lián)合Wellpoint了第一款商業(yè)用“基于沃森的認知計算系統(tǒng)”。
相對于參加《危機邊緣》時那個擁有幾十排服務器的家伙,從體型上看,這個新系統(tǒng)已經瘦身了不少,僅為一個雙門冰箱的大小。
其中一個很重要的原因是,《危機邊緣》中的問題涉及人文、歷史、地理、政治等眾多方面,選手們碰到相似問題的概率甚至小于3%,所以需要用數量眾多的服務器儲存足夠多的知識。而在具體應用到某一行業(yè)時,所需的知識量會小很多,而且遇到相似問題的概率也會提升很多,對服務器的數量要求也就隨之降低了。
沃森原有的Power750處理器也升級到了POWER7+,性能提升了50%。沃森可以用更短的時間處理更多的信息。原來回答問題需要3秒的話,現(xiàn)在就變成了2秒。
在IBM不斷改造和培訓沃森、試圖提升它的自我學習能力的同時,Google也在人工智能領域取得了突破—它們讓計算機認識了“貓”。
2012年6月,Google X實驗室用一個由1.6萬多個處理器、10億個內部節(jié)點組成的“虛擬大腦”,模擬人腦中“神經元”的概念,形成了一個“神經網絡”。這個神經網絡會不斷接收新數據。在一些模型的幫助下,神經元與神經元之間傳遞的數據發(fā)生了變化,它具備了初步的學習能力。
10天之后,這個“虛擬大腦”分析了1000萬幀從YouTube上隨機抓取的無標簽視頻剪輯圖片,并成功學習到了“貓”的概念,并從隨后導入的2萬張圖片中準確找出了有貓的照片。
這些試圖改變世界的工程師們的下一步,是使這些“學習模型”更聰明、更高效。
IBM正在琢磨怎樣把沃森部署到各行各業(yè)。就在這會兒,一臺沃森正在接受花旗銀行的崗前培訓,通過讀年報、財經新聞、招股說明書、監(jiān)視交易,以及學習更專業(yè)的金融術語,更好地給客戶推薦投資組合,或者回答諸如“接下去的3個月內哪家公司最有可能發(fā)生合并?”這樣的問題。
在這個過程中,沃森最大的問題在于學習的速度:如何在最短的時間內學習這個行業(yè)的知識、術語,并學會用這些知識進行“思考”。即便學習模型的架構被總體沿用下來,也會根據不同行業(yè)做出有針對性的調整。
沃森還需要變得更聰明。很多時候,病人并不能很準確地,甚至會錯誤地描述問題?!耙粋€病人說他頭疼,但他的問題可能在其他地方。”侯淼說:“這個時候,沃森就需要能夠識別出這些問題。”這也是將沃森運用到其他行業(yè)要面對的問題—那些“錯誤的描述”、“善意的欺騙”都需要它去識別和破解。
目前,美、英、日、德等發(fā)達國家憑借其經濟實力和技術優(yōu)勢,已經在數字醫(yī)學領域占得先機。高端的醫(yī)療影像設備、人工智能產品等大多來自發(fā)達國家,其在數字醫(yī)學基礎研究和技術應用方面的成果同樣引人注目。我國經歷二十多年的醫(yī)院信息化建設,各種信息管理與臨床信息系統(tǒng)遍及全院,數字化醫(yī)院成為綜合實力較強醫(yī)院追求的建設目標,遠程醫(yī)療快速發(fā)展,區(qū)域衛(wèi)生信息化建設成為醫(yī)藥衛(wèi)生體制改革的重點,公共衛(wèi)生信息化也取得了明顯的進展。
同時,自2001年以鐘世鎮(zhèn)院士牽頭提出構建“中國數字人”的設想開始,數字化技術在我國的基礎醫(yī)學研究便逐漸鋪陳開來,而多個國內數字醫(yī)學研究機構如南方醫(yī)科大學、清華大學、復旦大學、浙江大學以及青島大學附屬醫(yī)院與海信集團聯(lián)合成立的山東省“數字醫(yī)學與計算機輔助手術重點實驗室”等,分別在計算機輔助診斷系統(tǒng)、數字醫(yī)學影像設備、計算機輔助手術系統(tǒng)等領域投入了大量的科研力量,并取得令人矚目的成績。但是,我國在數字醫(yī)學的核心技術領域起步較晚,與發(fā)達國家仍有差距,想推動我國數字醫(yī)學快速持續(xù)發(fā)展,必須先對數字醫(yī)學的未來發(fā)展趨勢有深入的認識。
數字醫(yī)學的發(fā)展趨勢
目前,數字醫(yī)學基礎理論正逐步完善,數字醫(yī)學學科體系逐漸清晰,智能化、可視化、微電子等高新技術也將進一步與醫(yī)學檢測、診斷、治療等技術交叉滲透。數字醫(yī)學的未來發(fā)展趨勢主要體現(xiàn)在以下四個方面:
首先,未來會出現(xiàn)更加人性化的數字化醫(yī)院管理。功能單一的醫(yī)院信息系統(tǒng)的格局將被打破,PACS應用將會向區(qū)域、遠程發(fā)展,無線移動、重癥監(jiān)護、遠程醫(yī)學、數字化手術室建設將會涌現(xiàn),電子病歷在社區(qū)醫(yī)療以及大范圍的健康管理方面的應用會催生更多人性化的管理系統(tǒng)。隨著信息技術的高度滲透,數字化醫(yī)院必將會更注重信息提供利用的人性化,而且從管理到醫(yī)療,從門診到臨床都正在孕育著新的突破。
其次,數字醫(yī)療治療技術將會更加智能化。將人工智能與經典醫(yī)學理論和經驗知識構建集評估、診斷、決策與預測于一體的智能專家診斷系統(tǒng)將會在臨床診斷與治療中發(fā)揮重要作用,而隨著數字制造和智能制造飛速發(fā)展應運而生的智能醫(yī)療機器人,尤其是智能微型醫(yī)用機器人將會在一定程度上輔助醫(yī)生進行治療。智能化的數字醫(yī)學治療技術將會給傳統(tǒng)醫(yī)學治療帶來重大變革。
最后,微創(chuàng)化、無創(chuàng)化的數字醫(yī)療檢測技術將會不斷涌現(xiàn)。多種生理參數的測量能夠對人體健康狀態(tài)或疾病進行診斷,而基于多種光學成像技術的臨床應用將會是數字醫(yī)療檢測技術實現(xiàn)微創(chuàng)、甚至無創(chuàng)檢測的一個重要途徑。近紅外光譜技術、光學弱相干層析成像技術、多模態(tài)多光譜分子影像技術都將會實際應用在人體多種生理參數的檢測中,而且由于光學成像技術本身對于人體沒有損傷的特點,光學成像技術的進一步發(fā)展與應用將會推動數字醫(yī)療檢測技術微創(chuàng)化甚至無創(chuàng)化。
計算機輔助手術系統(tǒng)的發(fā)展
精準化的數字醫(yī)療診斷、手術技術正成為國內外研究熱點,這也是我國突破發(fā)達國家數字醫(yī)學技術壟斷的關鍵。其中,計算機輔助手術系統(tǒng)功能的日益強大,將會使精準外科手術成為可能,推動臨床外科的跨越式發(fā)展,也必將會成為醫(yī)學教育、醫(yī)學科研和臨床醫(yī)學的新手段。與計算機輔助手術系統(tǒng)相配套的醫(yī)用顯示器的規(guī)范與普及,能夠為醫(yī)生診斷提供更精確的判斷,推動遠程醫(yī)療和社區(qū)醫(yī)療的快速發(fā)展。數字芯片的進一步發(fā)展與嵌入對醫(yī)療診斷設備性能和便攜化的提升有著不可估量的作用。
目前,海信醫(yī)療設備有限公司通過與青島大學附屬醫(yī)院董教授合作,開發(fā)出了低輻射劑量下的低質量CT圖像消噪、增強技術,做出了一款世界水平的計算機輔助手術產品,該產品被命名為海信雙子3D醫(yī)學影像重建與計算機輔助手術系統(tǒng)(Hisense Gemini 3D Medical Imaging Reconstruction and Computer Assisted Surgery System,Higemi)。
它通過獨自開發(fā)的醫(yī)學圖像預處理和分割技術,只需在一幅圖像上設定相應參數和少量人工輔助,算法可以自動精確地在一系列CT圖像上分割出肝臟、血管、腫瘤、膽囊等肝臟各組織。然后,通過濾波、CT層間自適應對應點插值、形態(tài)學、模式識別等算法處理分割結果,追蹤肝臟三期圖像上肝動脈、門靜脈、肝靜脈的血管走形,并利用三維配準算法對三期肝臟數據進行立體配準,精確地三維重建肝臟、腫瘤和膽囊等器官。
它可以三維觀察病變與血管、臟器的關系,精確計算臟器、病變體積和門脈、靜脈各分支供血區(qū)域,實施虛擬手術切除,確定最佳手術切除線。它在最難的肝部成像領域能夠重建3級以上血管,區(qū)分0.6mm的腫瘤與血管間距,精確計算肝臟、腫瘤體積,極大地滿足醫(yī)生的臨床需要。Higemi在臨床上已經實際應用于多位小兒巨大肝臟的手術前模擬手術的規(guī)劃設計和術中指導,以及活體肝臟移植的肝臟手術前精準判斷。
未來,該產品將擴展到腦部、五官、神經外科和口腔等多個臨床醫(yī)學領域,形成功能強大的全身手術輔助系統(tǒng)。本產品利用了以下具體科學技術開發(fā):
1.低劑量或普通劑量CT圖像高清增強技術。海信開發(fā)的低劑量CT圖像高清增強技術是一種CT圖像后期處理技術,可以不對現(xiàn)有CT設備做結構性更改,將低輻射量低質量的CT圖像還原成高質量圖像。該系統(tǒng)可以減少50%~80%有害照射劑量(從300mAs降到60mAs)的情況下,仍達到同樣質量的成像效果。如果按照原衛(wèi)生部2012年公布的《GBZ165-2012 X射線計算機斷層攝影放射防護要求》,使用針對不同人群、不同部位CT檢查上限的輻射水平作增強型CT,得到的圖像再作此項高清處理,則可以得到非常清晰的CT圖像。利用此圖像,可以更精確地分割器官和病變組織,做出精確的器官三維重建圖形,非常有利于常規(guī)狀態(tài)下的疑難病例的診斷和手術方案規(guī)劃。該技術在世界處于領先水平,對提高現(xiàn)代醫(yī)學影像設備的性能和安全性有十分重要的意義。
2.醫(yī)學圖像分割技術。在大量DICOM標準的CT腹部掃描圖像上,根據灰度、紋理、血管生理特性等特征把二維圖像分割為不同的部分,找到分界線(如器官外沿、腫瘤外沿和血管外壁等)。真實精確地找到不同組織分界線,是后續(xù)工作的基礎。
3.建模,圖像追蹤技術。追蹤多幅圖像上肝動脈、門靜脈、肝靜脈三期的血管造影圖像的CT強度變化,建立自學習拓撲模型將每幅圖像中代表血管的CT值變化連接起來,形成血管走向信息。
4.模式識別技術。將分割出的不同組織分類并識別。
5.三維可視化,三維圖像配準技術。同期不同圖像間、不同期不同圖像間的配準、建模;不同組織或功能區(qū)成像的容量渲染、著色;透明顯示、任意斷面顯示、多平面顯示。
6.定性定量分析。器官和內部組織的參數測量,定性定量計算,如精確計算器官總體積和部分體積。
7.肝臟功能分段與手術模擬技術。1954年,Couinaud根據人體肝臟Glission系統(tǒng)的分支走向以及肝靜脈系統(tǒng)的回流將人體肝臟劃分為八段,由于人體肝臟血管走向的個體差異性,Couinaud方法并不具有普適性,尤其是針對肝內出現(xiàn)腫瘤、血管變異等復雜情況,單純依靠Couinaud方法進行肝臟分段并沒有實際臨床指導意義,實施肝臟精準手術迫切需要肝臟功能分段的精準導航。
隨著數字醫(yī)學的快速發(fā)展,現(xiàn)有的計算機輔助手術系統(tǒng)可以初步實現(xiàn)肝臟功能分段,同時為后期的模擬手術進行指導,與醫(yī)生直接根據二維影像確定手術方案相比,肝臟功能分段及手術模擬系統(tǒng)的出現(xiàn)又將精準手術的發(fā)展向前推進了一大步。
目前,大多數肝臟功能分段方法根據肝臟內血管分支走向和血管分支支配區(qū)域進行分段,這與解剖學中關于肝臟分段的解釋是一致的。其主要步驟包括:從二維影像信息進行精準血管信息提取,對重建后的三維血管系統(tǒng)進行骨架化操作,運用圖論相關方法進行血管智能化分支(鑒于肝臟內血管系統(tǒng)較為復雜,需要借助人工輔助進行不同血管系統(tǒng)的判定),根據近似分段模型進行全肝分段并進行體積測算。其中,從現(xiàn)有的二維影像信息中進行準確的血管信息提取是肝臟功能分段的基礎和前提;如何對骨架化血管進行智能化分支是極其關鍵的步驟,直接影響到全肝分段的結果;構造與肝臟實際功能一致的近似分段模型,能盡可能地減少手術出血率,降低術后并發(fā)癥的發(fā)生。借助于肝臟功能分段以及精準的肝段體積測算數據,醫(yī)生能方便、直觀地進行術前規(guī)劃。
目前,由于使用不同的血管骨架化方法和近似分段模型造成結果不同,如何統(tǒng)一業(yè)界功能分段標準,才能使肝臟分段更好地滿足手術臨床需要值得研究;由于肝臟血管系統(tǒng)的個體差異性以及腫瘤組織等的存在造成的肝臟畸形,目前必須借助少量人工輔助才能實現(xiàn)功能分段,如何實現(xiàn)完全自動化和智能化將成為未來肝臟功能分段的重要研究方向。
8.腫瘤定位及消融引導技術。近年來,隨著醫(yī)學、計算機學和生物學等的發(fā)展,腫瘤的治療技術正在發(fā)生重大的變革,如何采用微創(chuàng)或無創(chuàng)方法靶點殺死和滅活腫瘤,同時又能最大限度地保護周圍正常組織,已成為腫瘤治療的熱點。北美放射學會(RSNA)于1997年首次提出腫瘤消融的概念,即在超聲、CT、MRI等現(xiàn)代影像設備等的指導下利用物理或者化學(熱或冷效應)直接破壞異?;虿∽兘M織的技術。本產品具備的圖像配準是圖像融合的先決條件,必須先進行配準交換,才能實現(xiàn)準確地融合。之后進行的亞毫米級精度三維立體重建,能夠清晰顯示腫瘤大小、位置、數量及其與周圍重要結構、臟器的毗鄰關系,還能對腫瘤消融治療的療效進行評價。未來將US、CT、MRI圖像融合的新型影像融合技術,根據各自影像的特點結合起來進行優(yōu)勢互補,可以更準確地發(fā)現(xiàn)腫瘤、制定治療方案及引導穿刺和監(jiān)控消融。
9.符合Dicom標準的2D/3D圖形人機交互引擎技術。以上各種算法和相關功能的實現(xiàn),有賴于強大的符合Dicom標準的2D/3D圖形人機交互引擎技術,該技術是計算機輔助手術技術的核心難點之一,也是國內目前技術水平較弱的領域。海信集團開發(fā)的人機交互引擎將主流的OpenGL、DirectX、GPU加速等顯示方式以統(tǒng)一接口形式表現(xiàn),利于程序員開發(fā)調用。它涉及到多種類庫耦合、多線程、GDI (Graphics Device Interface) 等多種底層操作技術,Dicom文件編解碼等引擎底層分別編寫,形成一組功能齊全的2D/3D圖形人機交互引擎。海信Higemi計算機輔助手術系統(tǒng)即是基于此人機交互引擎實現(xiàn)了質的飛躍。
醫(yī)用顯示器的規(guī)范和普及
醫(yī)療顯示作為醫(yī)學影像的顯示終端,為了達到對醫(yī)學圖像的精確顯示需求,要求在顯示終端首先符合DICOM Part 14的標準,使顯示符合灰度標準顯示函數(GSDF),從而保證在閱讀醫(yī)學灰階圖像時能夠呈現(xiàn)出最精確的效果。而如果使用的普通顯示器是不符合醫(yī)學影像顯示標準的,則容易造成誤診。
在精準手術臨床輔助系統(tǒng)中,需要利用3D技術來展示更加真實生動的三維手術場景或CT/MRI人體器官圖像。眼鏡式3D顯示器由于需要醫(yī)生佩戴專用眼鏡,會影響到醫(yī)生手術操作,所以在未來會選用裸眼3D顯示器。目前較成熟的多視點裸眼3D技術是光柵式,一種是狹縫光柵,一種是柱鏡光柵。
首先,狹縫光柵方式裸眼3D顯示器亮度較低,主要用于個人用移動設備即小尺寸顯示中,而精準手術系臨床指導系統(tǒng)需要大尺寸的裸眼3D顯示器。這種大尺寸的裸眼3D顯示器一般采用柱鏡光柵,這種方式的顯示器同樣也存在一些目前無法突破的問題:1.由于光柵式裸眼3D顯示具有分光的作用,貼裝的光柵導致2D和3D信號的清晰度降低,難以滿足手術臨床指導顯示器的需求。2.存在視區(qū)角度小、視區(qū)突變問題,在突變區(qū)域會看到重影和不正常的圖像,同時立體景深和視區(qū)突變也是一個平衡關系,無法同時達到最佳狀態(tài)。目前有研究針對此問題開發(fā)了視點跟蹤技術,實時檢測觀看者在電視前的位置,將處在突變的區(qū)域調整為良好的視覺區(qū)域。但此方法更適合于單人觀看的設備,當手術中多名醫(yī)生觀看的時候,很難調整并保證觀看者都處于正常視區(qū)內。3.存在串擾問題、立體景深小于眼鏡式3D顯示器。
海信集團開發(fā)新型高性能的裸眼三維顯示設備和人機交互設備可以解決這些問題。該設備通過UHD液晶屏的采用和UHD電路、光柵的開發(fā),將3D分辨率提高到1280*720以上的高清標準,滿足手術臨床指導顯示器的需求;通過獨特渲染算法技術和柱鏡光柵的研究和配套開發(fā),解決視區(qū)角度小、視區(qū)突變的問題,擴大視區(qū),達到不用視點跟蹤能滿足多人同時觀看的要求;通過語音識別技術和手勢識別技術,開發(fā)新型人機交互控制設備,實現(xiàn)便捷的操作,解放醫(yī)生雙手,防止手術污染。
數字芯片在數字醫(yī)療領域中的發(fā)展
針對數字醫(yī)學影像設備的快速發(fā)展,應用高性能芯片進行設備集成化設計成為未來數字醫(yī)療設備發(fā)展的主流方向。為了滿足這個需求,芯片應滿足實時性和可靠性等要求。
首先是實時性,醫(yī)療設備需要快速的啟動、無延時的圖像顯示、無縫的功能/參數轉換,例如手術中的數字X射線影像、救護車與醫(yī)院的實時影像交流。其次是可靠性,需要器件能夠在各種環(huán)境下的長時間無故障運行,能夠迅速從軟件錯誤引起的故障中恢復,能夠電磁環(huán)境抗干擾。
在滿足性能需求的同時,還有一些因素需要考慮:1.體積,直接影響產品的便攜性,便攜性能使設備得到更廣泛的應用,將醫(yī)療保健從城市普及到鄉(xiāng)村及邊遠地區(qū)、災患區(qū)、醫(yī)院各個病房甚至救護車上;2.功耗,低功耗能大大延長設備續(xù)航時間,并有助于減小電池與設備尺寸;3.成本,低成本意味著更多人能夠享受最新的醫(yī)療技術,比如發(fā)展中國家與邊遠地區(qū)的居民。
針對上述目標,異質SoC(片上系統(tǒng))可以有效利用各種處理單元的優(yōu)勢,實現(xiàn)性能、功耗、體積、可配置性、可擴展性、開發(fā)效率(硬件&軟件)、一次性工程費用(NRE budget)等因素的優(yōu)化配置,成為當前的發(fā)展趨勢。一個很明顯的例子是,現(xiàn)在大多數高端嵌入式應用處理器都基于ARM內核(多核),并整合了圖形加速器,視頻編解碼加速器等資源,實現(xiàn)了全可編程SoC,通過可編程硬件、軟件及I/O,大大提高了系統(tǒng)的差異化與靈活性。
結語
關鍵詞:工業(yè)電氣自動化;自動化技術;發(fā)展
工業(yè)電氣自動化在發(fā)展的時候是離不開理論支持的,這也是工業(yè)電氣自動化發(fā)展的基礎。工業(yè)電氣自動化技術在制造業(yè)和民用產品中發(fā)展是非常好的,工業(yè)電氣自動化的發(fā)展是離不開計算機技術,計算機技術推動著工業(yè)電氣自動化技術的發(fā)展。工業(yè)電氣自動化實現(xiàn)了人工智能,使得工業(yè)生產中得到了巨大的進步。工業(yè)電氣自動化設備是一種智能設備,在使用的時候實現(xiàn)了與人類智慧相類似的反應。工業(yè)電氣自動化在研究對象方面是非常廣的,其中包括系統(tǒng)運行、自動控制、電力電子技術、信息處理、試驗分析以及計算機技術的應用。電氣自動化技術在工廠中的應用是非常廣的,電氣自動化技術逐漸成為了工廠發(fā)展的主要技術支持,在電子工廠中,電氣工程自動化體現(xiàn)在很多的方面,在編程和設計方面都要非常注意的。工業(yè)電氣自動化主要要研究的就是與電氣工程相關的自動化控制,在研究的時候,一定要不斷提高技術水平,這樣才能使電氣自動化得到更好的發(fā)展。
1 工業(yè)電氣自動化的定義
工業(yè)電氣自動化通俗的說法就是為了實現(xiàn)機器設備和裝置在無人操作的情況下,可以按照預先的設置程序或者是指令進行自動操作和控制的過程?,F(xiàn)在自動化技術已經在很多的行業(yè)得到了應用,在工業(yè)、農業(yè)、交通運輸業(yè)、醫(yī)療方面都有應用。自動化技術的應用可以將人力資源的工作強度降低,同時可以將部分簡單的腦力勞動實現(xiàn)自動化操作,同時在面臨惡劣環(huán)境和危險工作環(huán)境的時候,可以不必使用人力資源來進行工作,這樣可以更好的保護工作人員的生命安全。電氣智能化在勞動生產率方面得到了提高,同時也改變了人類認識世界和改造世界的能力。自動化現(xiàn)在已經成為了工業(yè)和農業(yè)發(fā)展的重要條件,同時也是工業(yè)和農業(yè)發(fā)展的重要標志。
2 工業(yè)電氣自動化的發(fā)展歷程
工業(yè)自動化出現(xiàn)在機械制造業(yè)中,隨著科學技術的不斷進步,計算機技術在自動化技術中得到了應用,這樣就使得自動化技術同計算機技術緊密聯(lián)系在一起,自動化技術也同信息化技術結合在一起,使自動化技術從生產過程中的最優(yōu)控制逐漸向綜合自動化控制階段。自動化技術在二戰(zhàn)之后對戰(zhàn)后發(fā)展格局的建立非常有幫助。自動化技術在不斷發(fā)展中,設計出了各種精密的自動調節(jié)裝置,這樣就使得自動化技術在系統(tǒng)和控制方面得到了新的發(fā)展。電子計算機技術的發(fā)展,推動著自動化技術向著更好的方向發(fā)展。電子計算機使得自動化控制系統(tǒng)在應用程序方面奠定了基礎,同時將邏輯控制技術直接運用到了產品的生產過程中。自動化技術在發(fā)展的過程中,機器的操作更加的簡單,同時實現(xiàn)了無人操作模式,使得生產過程更加的好。工業(yè)電器生產過程中,自動化程序在設計和使用的時候都是需要大量的研究的。
3 工業(yè)電氣自動化的應用
工業(yè)電氣自動化在含義方面包含著很多的內容,在形式方面,工業(yè)制造業(yè)的電氣化主要表現(xiàn)在三個方面,實現(xiàn)自動化以后可以代替人的體力勞動,還能代替人的腦力勞動,在一定程度上能夠協(xié)助人員更好的進行工作。自動化系統(tǒng)在進行制造的時候,實現(xiàn)了人和整個系統(tǒng)的協(xié)調性,同時在管理和控制方面也得到了更好的發(fā)展。工業(yè)電氣自動化在功能方面實現(xiàn)了代替人員體力勞動的作用,但這僅僅是自動化功能目標體系中的一小部分。自動化的功能表現(xiàn)在很多的方面,現(xiàn)在已經逐漸形成了一個有機的體系。自動化技術在使用的時候,不僅僅要在生產過程中進行應用,而是在整個產品生產周期中都是要應用的。工業(yè)電氣自動化是一個動態(tài)的概念,有著十分廣泛和深刻的內涵。在制造自動化應用的過程中,工業(yè)電氣自動化得到了更好的發(fā)展,工業(yè)電氣自動化是一門涉及非常廣,應用范圍廣泛的綜合性科學技術。工業(yè)電氣自動化作為一個系統(tǒng)的工程,主要包含五個方面,第一個方面是程序單元,這個單元主要要決定做什么和如何做。第二個方面是作用單元,在這個單元中,主要是施加能量和進行定位。第三個方面是傳感單元,這個單元主要是對性能和狀態(tài)進行檢測。第四個方面是制定單元,這個單元主要是對傳感單元發(fā)過來的信息進行比較,同時對信號的做出相應的指令。最后一個方面是控制單元,主要是制定和調節(jié)單元結構。
工業(yè)電氣自動化的研究內容主要有自動控制和信息處理兩個方面,包括理論、方法、硬件和軟件等,從應用觀點來看,研究內容有電器產品過程的自動化、機械制造自動化、管理自動化、實驗室自動化和家庭自動化等。工業(yè)電氣過程自動化石油煉制和化工等工業(yè)中流體或粉體的化學處理自動化。20世紀60年代以后,由于電子計算機的應用,出現(xiàn)了數控機床、加工中心、機器人、計算機輔助設計、計算機輔助制造、自動化倉庫等。研制出適應多品種、小批量生產型式的柔性制造系統(tǒng)(FMS)。以柔性制造系統(tǒng)為基礎的自動化車間,加上信息管理、生產管理自動化,出現(xiàn)了采用計算機集成制造系統(tǒng)(CIMS)的工廠自動化。
4 工業(yè)電氣自動化的發(fā)展趨勢
工業(yè)自動化的發(fā)展不僅實現(xiàn)產品方面的改變,同時也要改變現(xiàn)代工業(yè)的發(fā)展情況,工業(yè)自動化使工業(yè)產品更加的人性化,同時在資源利用方面也做到了更好,工業(yè)自動化對降低生產成本是非常有幫助的。工業(yè)自動化不僅僅可以給經濟發(fā)展帶來更好的社會效益,同時也能給生產企業(yè)帶來更多的經濟效益。企業(yè)在發(fā)展的時候,要不斷發(fā)展工業(yè)自動化技術,這樣不僅可以提高工業(yè)技術的水平,同時還能縮小我國在工業(yè)技術方面同發(fā)達國家之間的距離。在提高工業(yè)自動化水平的時候,可以通過自主研發(fā)的方式來進行,同時要重視工業(yè)自動化對經濟發(fā)展的作用。工業(yè)自動化在發(fā)展的過程中,要不斷應用新的技術,計算機網絡技術在工業(yè)電氣自動化中的應用效果就是非常明顯的,計算機技術可以使各個運行的部分更加的緊密,同時實現(xiàn)了操作的一體化,這樣使得工業(yè)自動化在操作方面更加的便捷,同時也能減少人員的工作強度。工業(yè)電氣自動化在在發(fā)展的過程中,更加的開發(fā),而且在信息化方面更加好。開放化就是要將系統(tǒng)與外界建立聯(lián)系,實現(xiàn)電氣自動化的各方的網絡連接,提高信息處理能力;分布式的結構可以保證在網絡中建立起獨立的網絡,以實現(xiàn)把安全危險分散,促進電氣自動化系統(tǒng)的正常運行;而信息化就是實現(xiàn)設備與網絡技術相結合,實現(xiàn)網絡自動化和管控一體化。
5 結束語
我國加入世界貿易組織以后,企業(yè)面臨的市場競爭更加的激烈,為了提高企業(yè)的競爭能力,企業(yè)要從產品銷售價格上取得優(yōu)勢,這樣就要降低產品的生產成本。企業(yè)在進行生產的時候,要吸取高科技先進的經驗和技術,為實現(xiàn)自主研發(fā)提供條件。同時,將科學發(fā)展觀作為前進的基礎和指導思想,根據每個地區(qū)部門的實際情況,以人為本,及時發(fā)現(xiàn)問題,總結先進的經驗,改變傳統(tǒng)的發(fā)展觀念,尋找一條合適的發(fā)展道路。工業(yè)電氣自動化的發(fā)展目標是人工智能化,這在人類制作機器表達出來的人工智能,體現(xiàn)了自動化的特征優(yōu)勢。因此智能化技術在電氣工程自動化控制中可以發(fā)揮最大的效用,使人類享受高科技的幸福。
參考文獻
[1]范然,楊健.電氣系統(tǒng)中自動化發(fā)展方向的探究[J].中國新技術新產品,2012(02).
關鍵詞:數據挖掘;循證醫(yī)學;區(qū)域衛(wèi)生信息平臺;分析平臺
1 引言
隨著大數據時代的到來,數據挖掘和模式識別已經逐漸成為新的醫(yī)學科學研究范式。而臨床大數據集具有數據格式多樣、復雜且難于統(tǒng)一,使得很大一部分臨床數據得不到有效的利用。因此,如何根據循證醫(yī)學特點,合理利用數據挖掘技術,獲取有價值的治療證據是循證醫(yī)學的關鍵所在。
寧波市區(qū)域衛(wèi)生信息平臺自2013年建設開始,目前已接入市屬8家醫(yī)療機構和鄞州區(qū)、海曙區(qū)、江東區(qū)、江北區(qū)、鎮(zhèn)海區(qū)、奉化市、余姚市、慈溪市、寧??h、奉化縣等區(qū)市縣級平臺以及市級公共衛(wèi)生專業(yè)機構,實現(xiàn)了醫(yī)療服務信息和公共衛(wèi)生服務信息的采集與交換。
本文從循證醫(yī)學視角出發(fā),構建電子健康檔案和電子病歷信息資源整合與挖掘的宏觀模型和數據分析系統(tǒng),對數據采集、數據挖掘等幾環(huán)節(jié)進行設計,把紛繁復雜的醫(yī)療數據轉變成有價值的信息,初步實現(xiàn)了對醫(yī)學數據的交融擴展及挖掘分析的目的,為醫(yī)學科學研究、臨床診療、衛(wèi)生決策、公眾服務制定提供依據,其中包括:①幫助尋找最佳藥物組合及標準化治療方法,提高診療效果;②預測慢性疾病風險,查明罹患疾病幾率;③協(xié)助醫(yī)院評估、監(jiān)測和提高患者治療的安全性;④優(yōu)化醫(yī)院資源利用等等。
2 系統(tǒng)的架構及功能
系統(tǒng)采用B/S結構、面向對象的設計,以C#作為開發(fā)工具結合MSSQLServer數據庫技術開發(fā)而成。系統(tǒng)由數據采集、數據管理、數據應用、平臺訪問、平臺管理五大類模塊組成[1]。
平臺功能可分為智能報表分析、動態(tài)表單管理、動態(tài)數據庫管理、動態(tài)數據庫管理以及動態(tài)數據接口管理。系統(tǒng)采用高性能的緩存機制,確保網站訪問速度;采用強大的安全機制,防止各種注入式攻擊等漏洞;系統(tǒng)充分考慮了底層大數據量并發(fā)的性能問題。
3 系統(tǒng)的應用
3.1統(tǒng)計分析 統(tǒng)計數據分為傳染病數據、高血壓數據及門急診數據三大類別,各類數據可根據時間、地區(qū)、患者年齡、患者淶源、性別、職業(yè)、疾病等進行分項統(tǒng)計。數據展示形式可分為曲線圖、柱狀圖、餅圖、漏斗圖等。
3.1.1傳染病統(tǒng)計 系統(tǒng)可將傳染病報告例數按年份、月份、地區(qū)、年齡、性別、職業(yè)、疾病病種進行分項統(tǒng)計;圖1、圖2中分別顯示了2011年~2014年傳染病報告例數的逐月分析和按病種分析。
3.1.2 高血壓統(tǒng)計 根據系統(tǒng)對已進行登記管理的高血壓人群相應地區(qū)、年齡、性別的統(tǒng)計分析,我們可以對高血壓病的易感人群開展重點防控。見圖3。
3.1.3門急診分析 門急診統(tǒng)計可以對寧波市屬各醫(yī)療機構及全市總門急診量進行逐月統(tǒng)計。見圖4。
3.2 數據預測
3.2.1 算法介紹 數據預測采用了移動平均算法,移動平均法是用一組最近的實際數據值來預測未來一期或幾期內數據的一種常用方法。移動平均法適用于即期預測、能有效地消除預測中的隨機波動。
移動平均法是一種簡滑預測技術,它的基本思想是:根據時間序列資料、逐項推移,依次計算包含一定項數的序時平均值,以反映長期趨勢的方法。因此,當時間序列的數值由于受周期變動和隨機波動的影響,起伏較大,不易顯示出事件的發(fā)展趨勢時,使用移動平均法可以消除這些因素的影響,顯示出事件的發(fā)展方向與趨勢(即趨勢線),然后依趨勢線分析預測序列的長期趨勢[2-3]。
移動平均法可以分為:簡單移動平均和加權移動平均,系統(tǒng)采用的是簡單移動平均算法。簡單移動平均的各元素的權重都相等。簡單的移動平均的計算公式如下:
Ft=(At-1+At-2+At-3+…+At-n)/n
在此公式中,oFt表示對下一期的預測值;on表示移動平均的時期個數;oAt-1表示前期實際值;oAt-2,At-3和At-n分別表示前兩期、前三期直至前n期的實際值。
3.2.2 預測效果
3.2.2.1傳染病預測 根據2011年1月~2014年12月這一段時間的傳染病數據,運用移動平均算法對數據進行處理,預測2015年度寧波市傳染病發(fā)病數量預測,見圖5。
3.2.2.2 門急診預測 在寧波市某醫(yī)院2014年門急診量數據的基礎上,運用移動平均算法對2015年該院的門急診量進行預測,圖6為2014年該醫(yī)院的門急診量統(tǒng)計,預測結果見圖7。
4 討論
該數據挖掘系統(tǒng)有效地利用了區(qū)域衛(wèi)生信息平臺中的海量數據,采用海量檢索、人工智能和統(tǒng)計學等方法對寧波地區(qū)傳染病、慢性病中涉及的循證醫(yī)學統(tǒng)計指標進行分析,對醫(yī)院門急診量進行預測,有助于寧波地區(qū)醫(yī)療管理用戶更加合理、有效地配置衛(wèi)生資源及配套設施,為各項醫(yī)療計劃的制定,及決策的實施提供可靠的理論依據。隨著科技的進步,數據挖掘技術在疾病診療、藥物應用,及醫(yī)療決策支持中的挖掘應用范圍會越來越廣,數據挖掘分析平臺將衍生出更多面向具體問題的分析子平臺,從而能夠更好的為疾病診療帶來保障。
參考文獻:
[1] 孫向東,黃曉琴,朱春倫,等. 基于循證醫(yī)學的海量醫(yī)學數據挖掘分析方法研究[J]. 醫(yī)學信息學雜志,2015,(3):11-16.
選來選去,張銳最后決定從醫(yī)療健康入手。這是冷門方向,但他認為自己創(chuàng)辦的移動平臺應用春雨掌上醫(yī)生的生存空間是中國供需不平衡的醫(yī)療市場,伴隨著人口老齡化的加速,這一市場空間會進一步放大。
“想象一下,一個人感到頭疼或者腰疼的時候,會選擇去醫(yī)院還是其他辦法?”張銳對《環(huán)球企業(yè)家》說:“人們出現(xiàn)輕微的病痛時很少會去醫(yī)院”。他解釋說,按照醫(yī)學常理,人們的病痛分1至10,大多數人在1至7級病痛時,很少去醫(yī)院就診,只有在7至10級才會看醫(yī)生。而春雨掌上醫(yī)生所要解決的問題便是人們1至7級的病痛—這大都是人們相對瑣碎的小的病患需求。
在互聯(lián)網中,已有一些醫(yī)療主題的網站,很多人也會在百度知道以及一些論壇中求助醫(yī)療信息。不過,在張銳看來,網絡中關于醫(yī)療的數據,一方面它們是非機構化的,要想從紛繁復雜的網絡世界找到針對性的信息與指引十分困難;另一方面是非專業(yè)性的,甚至可能只是某些網友一腔熱忱的經驗認識。
解決“看病難”,也是“春雨”的目標之一。張銳介紹說,因為自己祖父與父親都是醫(yī)生的緣故,他對醫(yī)患供需不平衡的矛盾有著更深的認識:醫(yī)生的確很忙—醫(yī)生一上午要看30個病人,每天都有人在醫(yī)院排隊。一個職業(yè)醫(yī)生,一周被切割為14個半天,其中有2個半天要看門診,3個半天要巡視病房,這些時間段的確很忙;但其他時間可能是做科研和出席各種研討會,這時候醫(yī)生并非外界想象得那樣忙得不可開交。這些醫(yī)生零碎的空閑時間,可以通過一個方便的平臺解決病人不緊急的問題。
移動診療
有了市場供需矛盾的認識之后,張銳與網易一同出來的合伙人開始琢磨起這款最終命名為“春雨掌上醫(yī)生”的產品。這款產品分為用戶健康自查與向醫(yī)生問診兩個部分。
在用戶健康自查模塊是以三維立體的機器人形象頁面,用戶可以根據自己的病痛部位點擊機器人相應的部位,點擊之后,后臺程序會帶你進入相應的癥狀欄目,選定相應癥狀之后,便會進入下一個欄目—具體病癥中去了解其概述、癥狀、檢查、分科以及治療方式等欄目,當然,更為重要的是,后臺程序會識別用戶的地理位置信息,提供附近就診的醫(yī)院或藥店,甚至還有附近相應科室的醫(yī)生信息。
張銳分析說,其實用戶健康自查這個模塊,相對比較簡單,這只是將互聯(lián)網上非結構性、非專業(yè)的病患資料進行結構化的專業(yè)整理。通過有經驗的醫(yī)生資源將人們所能遇到的病例進行有針對性的篩選,春雨掌上醫(yī)生更多的只是扮演著數據梳理的角色。
真正復雜,同時也更有效果的,還是“春雨”為用戶提供的“咨詢醫(yī)生”模塊。這個模塊解決的問題是,如何通過移動互聯(lián)網技術,將醫(yī)生自有的閑置時間利用起來,面向全國各地的患者。
“咨詢醫(yī)生”模塊的基礎是,“春雨”必須拉來足夠多的好醫(yī)生,并且鼓勵他們利用閑暇時間回答病人的咨詢問題。張銳告訴我們,他的團隊花了4個月的時間,在全國各地拉來了4000多位醫(yī)生入駐“春雨”,讓這4000名醫(yī)生成為最初的“種子醫(yī)生”。
“春雨”以補貼的形式,用最直接的經濟利益,驅動和鼓勵這些“種子醫(yī)生”回答患者問題,一個問題給醫(yī)生人民幣6塊錢。獲得這批種子醫(yī)生之后,張銳也進一步采取了醫(yī)生相互推薦的制度,通過這批“種子醫(yī)生”吸引來更多的醫(yī)生朋友過來。
根據介紹,由于用戶數龐大,用戶每天都有非常多的問題,目前“春雨”平臺只開放了1500個問題,平均每天有1300多個可以得到比較滿意的答復。不過,隨著用戶數繼續(xù)擴大,張銳也面臨著新的問題:一方面醫(yī)生數量依舊有限,而另一方面,如果繼續(xù)補貼,“春雨”的成本還將增加,并且這種慣性會把“春雨”嬗變成“網上醫(yī)院”。無論是出于成本,抑或是出于政策風險,這種模式始終難以為繼。
為此,張銳給“春雨”提出了新的規(guī)劃與定位:讓醫(yī)患雙方在“春雨”的平臺上,自行定價問診—或是患者提出一個問題,并開出相應的價格,由有時間的醫(yī)生們選則,或是由醫(yī)生開出報價,患者向他提出問診。
按照張銳的設想,“春雨”的未來,更像是一個健康服務的“淘寶平臺”,或健康問診的拍賣市場。這一平臺最基礎的條件便是移動互聯(lián)的發(fā)展,通過智能手機和互聯(lián)網,醫(yī)生的閑暇時間有了充分的利用,而用戶亦可以足不出戶,突破地理位置的限制看病。張銳告訴我們,在“春雨”的平臺上,有一名協(xié)和的醫(yī)生,他每天都是在下午6點至8點之間回答病人問題,“因為這時候是他在下班回家的路上”。這就是典型的移動互聯(lián)應用場景。
病狀自查與咨詢醫(yī)生兩個模塊之下,是疾病庫、健康播報與個人中心。疾病庫的作用不言而喻,它旨在為關注健康的用戶提供一個疾病詞典,而健康播報則是提高用戶活躍度的一個重要產品—即便用戶在健康的狀態(tài)下,也可以根據自己的設定,訂閱一些健康養(yǎng)生方面的新聞和資訊。張銳介紹說,個人中心是一個增加用戶黏性的設置,也是“春雨”未來最重要的一個基礎。通俗的說,它是病人的電子病歷,將為注冊用戶提供包括疾病、醫(yī)生、醫(yī)院、用藥等信息在內的個人健康檔案。
創(chuàng)業(yè)前,張銳曾問過做醫(yī)生的父親一個問題,“你們醫(yī)院有多少醫(yī)生?最多有多少病人?”,父親答到:“180多個醫(yī)生,1000多病人?!?/p>
張銳想了想,自豪地告訴父親,他可以做一個有1萬醫(yī)生,容納10萬個病患者的醫(yī)院。目前,他已經完成了對父親的許諾。但“春雨”這個超級醫(yī)院顯然還能擴張到更多的手機、平板電腦之上。
周鴻祎
職位:奇虎董事長
主要產品:360安全衛(wèi)士
點評:已有近4億用戶選擇360安全衛(wèi)士來防殺木馬、優(yōu)化電腦性能。360安全衛(wèi)士已成為廣受歡迎的安全軟件。周對消費者需求的洞察和把握更令人稱道。
岳國峰
職位:百度無線事業(yè)部總經理
主要產品:掌上百度
點評:這是一款手機客戶端,內置了無線搜索,且移植了百度貼吧、百度知道等百度產品。雖然不是瀏覽器,但貼吧、知道等模塊是通過百度數據接口直接調用數據,速度遠遠快于其他基于WAP的瀏覽器,且產生的流量很低。另外,掌上百度還提供論壇入口、新聞資訊、天氣、網絡小說、網址導航等實用信息。掌上百度很可能將陸續(xù)移植百度旗下其他基于網頁的產品,成為百度在無線領域的產品“集中營”。
丁磊
職位:網易CEO
主要產品:有道詞典
點評:2007年9月網易旗下搜索引擎有道第一版有道詞典桌面版,至今,在有道詞典全平臺的1.6億用戶中,手機端占6000萬,PC端過億。詞典的手機端利用海量的在線詞庫句庫,不占手機內存,方便快捷。憑借搜索引擎的優(yōu)勢,實時收錄互聯(lián)網上最新最流行的詞匯,ORZ這樣的網絡詞語也不放過。
成從武
職位:高德軟件有限公司CEO
主要產品:高德地圖、高德導航
點評:2009年,針對iPhone、Andriod Pad和新版Andriod手機的“高德地圖”正式。成從武表示高德將逐漸向移動互聯(lián)網業(yè)務轉型,未來將定位于移動生活位置服務門戶。目前高德地圖有近5800萬用戶,高德導航已有將近7000萬用戶。
馬健
職位:金山網絡產品經理
主要產品:金山電池醫(yī)生
點評:通過在充電時的適當維護,延長電池壽命。金山電池醫(yī)生不僅能提供十幾項省電技巧,還能預測電池可用電量(準確到分鐘),避免電量不足的尷尬。
雷軍
職位:小米手機董事長
主要產品:小米UI
點評:MIUI是小米公司旗下基于Android系統(tǒng)深度優(yōu)化、定制、開發(fā)的第三方手機操作系統(tǒng)。與其他手機操作系統(tǒng)不同的是,MIUI是動員幾十萬網友每天刷機,并根據其反饋意見構造出來的。產品小組還根據測試用戶的反饋意見,每周五更新改進。MIUI支持23個國家的語言,在16個國家有粉絲站,一半用戶來自于國際市場。
李森和
職位:ZAKER CEO
主要產品:扎客ZAKER
點評:個性化定制閱讀和分享軟件,將微博、博客、報紙雜志、網絡新聞、圖片、RSS、團購、谷歌閱讀器等眾多內容,按照用戶個人的意愿聚合到一起,用看雜志的方式輕松閱讀。用戶綁定微博后,可與好友進行分享、互動。這一產品符合移動互聯(lián)網帶來的碎片化、淺閱讀的讀者行為習慣。
王小川
職位:搜狗CEO
主要產品:搜狗輸入法、瀏覽器、搜索引擎
點評:自2010年8月搜狗從搜狐拆分為一家獨立的公司,搜狗的業(yè)績增長十分迅速。王小川曾表示,搜狗輸入法是一級火箭,瀏覽器是二級火箭,搜索是三級火箭,最后的發(fā)射來自前兩級的推動。
馬瑞麟
職位:長安福特馬自達汽車有限公司總裁
主要產品:福享連篇
點評:除了互動體驗長安福特全系產品、靚麗的車模秀,這個小工具還提供天氣情況、洗車指數、限行提示和愛車保養(yǎng)方面的常識。長安福特在2010年底推出的這一蘋果應用,成為國內汽車企業(yè)利用數字營銷資源的成功案例。
俞永福
職位:UCWEB CEO
主要產品:UC瀏覽器
點評:作為一款智能手機瀏覽器,UCWEB擁有獨創(chuàng)的U3內核和云端技術,支持HTML5應用,是閱讀、看視頻、上微博、玩游戲、網上購物等眾多移動互聯(lián)網體驗最常用的工具,能為用戶節(jié)省流量提高上網速度。
打造一款優(yōu)秀的產品,您的方法論是?
成功的產品,都是不斷試錯調整出來的,它反映的是真正的用戶需求。相反,你只做宏觀的規(guī)劃,靠邏輯、理性來定義產品,往往與用戶的需求偏離更遠。微創(chuàng)新就是要小步快跑,不怕失敗。
李學凌
職位:多玩游戲CEO
主要產品:多玩YY
點評:游戲玩家的必備“武器”,解放雙手,在虛擬世界笑傲江湖、征戰(zhàn)沙場、過關斬將的同時可以實現(xiàn)團隊語音互動。如今YY已經延伸至音樂、教育等各個領域。在淘寶事件中其再次火了一把。
袁輝
職位:贏思軟件CEO
主要產品:小i機器人
點評:國內最早的網絡機器人之一,在上網的同時,可以實現(xiàn)人機語音交流,機器人語音識別率和自然度高。
劉慶峰
職位:科大訊飛董事長
主要產品:訊飛語點
點評:語音助手應用軟件, 改變用戶使用習慣,通過語音即可實現(xiàn)聊天、撥號、文本輸入、內容搜索、咨詢答復、備忘錄等多種功能,偏重實用,反應速度快,語料豐富。
郭秉鑫
職位:Talkbox CEO
主要產品:TalkBox 語音聊
點評:6個人的小團隊先于米聊和微信開發(fā)出TalkBox 語音聊,成為最早解放用戶“雙手”的語音發(fā)送工具。
Paul Ricci
職位:Nuance 公司 CEO
主要產品:聲龍聽寫(《Dragon Dictation》中文版)
點評:語音識別應用,在輕松自然說話的同時,可將語音轉換成要發(fā)送的文字信息或電子郵件,識別度高,甚至可以“聽”得懂方言。
王金星
職位:艾伏銳(北京)總經理
主要產品:EverFriends
點評:不同于大部分人機語音交互應用,EverFriends虛擬化了服務人物并取名Brainy(布蘭妮) 和 Spoony(史卜尼),可以唱歌,講故事,注重娛樂性。
打造一款優(yōu)秀的產品,你的方法論是什么?
最好的用戶體驗加上獨特的核心技術,同時遵循大道至簡的設計原則。就訊飛的移動互聯(lián)網產品而言, 我們的做法是在把握好產品核心定位的基礎上從簡單做起,然后在認真分析用戶需求的基礎上進行快速換代。 藝術來源于生活又高于生活, 打造一款優(yōu)秀的產品也是這樣。
做一名優(yōu)秀的產品經理,所需要的關鍵能力是什么?
“源于熱愛”——做一個優(yōu)秀產品經理的前提是對產品發(fā)自內心的熱愛和激情。三項關鍵能力:透徹理解客戶需求,深刻把握核心技術,良好的溝通技巧和協(xié)調能力。
消費者需求正在發(fā)生什么樣的變化?
過去的20年中,互聯(lián)網一直在深刻的改變著人們的生活。 技術上的發(fā)展使得信息獲取的成本無限降低,同時溝通的效率無限提高。消費者根本的需求沒有改變,但需求的表現(xiàn)形式由于互聯(lián)網的發(fā)展而不斷地發(fā)生變化。
關鍵詞: [甲狀腺結節(jié); 超聲特征; 不平衡性; 改進的集成學習
中圖分類號: TP391
文獻標志碼: A
文章編號: 2095-2163(2016)06-0012-05
0引言
在甲狀腺結節(jié)的臨床治療過程中,醫(yī)生的首要內置目標即是判別結節(jié)的良惡性,而對于惡性結節(jié)患者需及時采取有效重要的手術治療。但是在臨床實踐中,為了準確判別患者結節(jié)的良惡性特征屬性,醫(yī)生首先對疑似或確診為甲狀腺結節(jié)的患者設計指定超聲檢查,然后根據超聲檢查的各項指標,對疑似惡性結節(jié)患者增加細針穿刺活檢,由此方可初步確定患者的良惡屬性,最后才會得出推薦手術治療的終診論斷[1]。不難看出,患者診斷結果的準確性主要依賴于醫(yī)生的主觀判斷。由于不同醫(yī)生的臨床經驗和醫(yī)院醫(yī)療設施等存在差異,勢必會造成不同程度的結果誤診。如此一來,將不僅嚴重影響患者正確治療的展開推進,危及患者身體健康,而且也將對醫(yī)療資源造成一定的損失和可觀浪費。
為了幫助提高醫(yī)生臨床診斷的準確性,同時降低患者誤診率,簡化患者前期檢測的定制流程。近年來,越來越多的學者試圖通過機器學習、專家系統(tǒng)等人工智能方法進行甲狀腺結節(jié)良惡性鑒別。其中,集成學習作為使用上具備廣闊領域的機器學習算法之一,設計思路就是在對新的實例進行分類的時候,把若干個單一分類器集成起來,通過對多個分類器的分類結果構建某種組合來確定最終的分類,以取得比單個分類器更好的性能。因此在一般情況下,集成學習預測效果均要優(yōu)勝于絕大多數機器學習算法。
但是目前大多數研究都是基于甲狀腺超聲圖像數據,或者經過挑選之后比較完整的文本特征數據,再采用已有的機器學習方法直接送入模型訓練,而卻未曾考慮到真實醫(yī)療數據的稀疏性和不平衡性問題,因此得到的結果都存在一定的改進余地與完善空間。進一步研究可知,醫(yī)療數據的稀疏性主要體現(xiàn)在數據提取的缺失性上,由于患者病癥的不同,提取的規(guī)則不同,難免會導致許多缺失數據,也即稀疏數據。而不平衡性則體現(xiàn)在患者的實際診斷結果上,由于大部分結節(jié)都是良性結節(jié),造成數據中良惡性樣本失衡。
為此,本文通過在目標函數中加入自定義項對集成學習算法來設計實現(xiàn)改進,提出一種基于改進集成學習的甲狀腺結節(jié)良惡性鑒別方法,最大程度上消除數據的稀疏性和不平衡性對實驗結果造成的影響,同時提高預測結果準確率。具體而言,該方法主要包括:在真實醫(yī)療數據集上,先通過有放回的抽樣方法獨立地從數據集大類樣本集中隨機抽取多個樣本子集,使每次隨機抽取的樣本數量與小類樣本數量一致,再將各抽取的樣本子集分別與小類樣本集組合成多個新的訓練樣本集。對多個新樣本集的特征子集以集成學習的方式采用投票機制進行投票,數據集的最終特征子集以得票數目超過半數的特征共同組合而成[2]。然后利用改進的Boosting算法,在節(jié)點分裂過程中自動利用特征的稀疏性,加快模型訓練速度。實驗結果表明,本算法相對于已有的機器學習方法具有更高的準確率,在真實醫(yī)療數據集和UCI標準數據集上分別達到92.43%和94%。
文章第1節(jié)概述了在甲狀腺結節(jié)判別方面的相關研究;第2節(jié)展現(xiàn)了對數據的基礎預處理設計;第3節(jié)具體描述了改進的Boosting算法;第4節(jié)通過與傳統(tǒng)機器學習方法的實驗對比,論證本算法的優(yōu)異性;第5節(jié)給出本文的結論并對未來工作做出展望。
[BT4]1相關工作
通過機器學習方法提高對疾病的診斷預測準確率已經成為智慧醫(yī)療的一個重要實現(xiàn)途徑,當下則有很多學者在甲狀腺結節(jié)的診斷分類方面開啟、并推進了相關研究。具體展開如下。
在數據的不平衡性處理上,David Masko對正例樣本進行過抽樣處理,人工注入樣本使得正例樣本的數目增加,使得正負樣本達到平衡[3];Rok Blagus對少數類數據集規(guī)劃執(zhí)行數據預處理后,即運用過抽樣和欠抽樣相結合的改進方法,再利用交叉驗證的方法來得到效果驗證,改進效果明顯[4]。
在甲狀腺結節(jié)的預測鑒別研究上,熊偉等人提出了一種利用局部紋理特征與多示例學習相結合的方法,從感興趣區(qū)域提取其局部紋理特征,將感興趣區(qū)域看作由所有局部特征構成的示例包,最后利用KNN算法來實現(xiàn)對甲狀腺結節(jié)的分類,準確率達85.59%[5];Jieming Ma等人提出一種基于SVM的甲釹俳嶠げ夥椒ǎ并且為了防止模型的過擬合,在普通SVM模型的代價函數中加入懲罰項生成設計優(yōu)化,準確率達86.6%[6];李前程等人將結節(jié)的良惡性作為因變量,以超聲表現(xiàn)作為自變量,采用二分類logistic 回歸分析篩選出對甲狀腺結節(jié)良惡性有顯著鑒別作用的超聲指標并建立回歸模型,準確率可達89.91%[7];張振宇等人對基于k-means聚類的動態(tài)集成算法研究了創(chuàng)新改進,提出了一種選擇加權動態(tài)集成方法,采用多個分類器進行并聯(lián)集成,以此來增加分類模型的穩(wěn)定性,準確率則達到了90.2%[8]。
[BT4]2數據預處理
針對甲狀腺結節(jié)患者治療的臨床經驗以及某三甲醫(yī)院患者的實際超聲指標特征,實驗前先將非結構化的醫(yī)療數據進行結構化處理[9],提取出研究需要的指標以及對應的文本描述。然后將表示特征指標程度的文本變量轉換為算法能夠處理的數值型變量[10]。
為了降低信息重疊造成的結果失真,研究中利用主成分分析法對諸多的特征作出選擇,在最大化保留原始數據信息的前提下,去除不必要的特征,提升模型訓練速度和結果準確度。首先對原始數據設定修正達到標準化,計算其相關系數矩陣,求出特征值與特征向量,然后選取累計貢獻率達到85%以上的特征值對應的主成分,替換原始特征變量[11]。[JP2]經過主成分分析后,選擇使用血流模式、血供程度、回聲分布、包膜接觸面積、甲狀腺實質血供、結節(jié)邊界等16項指標作為輸入特征變量,以其對應的結節(jié)病理診斷結果作為預測輸出變量。[JP]
在數據平衡性方面,研究則利用改進的SMOTE算法對惡性結節(jié)樣本進行過抽樣處理,人工注入樣本使得樣本數量增加;對良性結節(jié)樣本進行欠抽樣處理,將譜聚類算法引入其中,選取樣本的子集即可使數據集在良惡性樣本的數目上趨于平衡,提高試驗結果的準確性。
4實驗結果與模型評估
[BT5]4.1參數確定
為了找到算法的最優(yōu)結果,需要通過實驗確定各參數的最佳值。一般情況下,各參數需要同時考慮,才能得到全局最優(yōu)值,但是考慮到此處的特殊性,當迭代次數足夠大時,模型的分類準確率趨于穩(wěn)定,因此實際調參過程中通過設置足夠大的迭代次數、如1 000次,可以得到最優(yōu)的樹深度,然后在此最優(yōu)深度下選擇最優(yōu)的迭代次數,避免不必要的空間和時間浪費。在此,將給出預測準確率與樹深度間的對應關系,如圖1所示。
從圖1中可看出,當樹深度為3時,模型的預測準確率達到最大,具體為92.43%。分析原因在于:原則上當樹深度增加時,模型復雜度也隨之增加,對數據的分類也就越準確,但當樹深度達到一定數量(在這里是3)后,再增加樹深度只會造成過擬合,在測試集上的準確率反而會出現(xiàn)下降。
接下來,研究中進一步給出了預測準確率與迭代次數之間的統(tǒng)計關系,結果示意如圖2所示。
從圖2可以看出,當迭代次數達到400次以后,預測準確率達到最大,具體為92.43%。至此,本模型參數確定為樹深度為3,迭代次數為400次。
[BT5]4.2模型評估
模型評估是檢驗設計模型是否具有使用價值的重要依據,是模型建立過程中必不可少的基礎有益環(huán)節(jié)。本文擬將從混淆矩陣和ROC圖像兩個方面進行模型評估。
4.2.1混淆矩陣
混淆矩陣主要用于比較模型預測值同實際真實值之間的差別,是一種常用且有效的模型評估方法[13]。實驗以297名患者的數據作為測試集,對比預測值與實際值之間的差別。實驗結果如表1所示。
從表1可以看出,算法預測準確率達到92%。其中惡性結節(jié)預測準確率達到86%,召回率達到96%,也就是說幾乎所有的惡性結節(jié)患者都能獲得正確識別。作為對比,該醫(yī)院的真實臨床數據卻清晰地顯示出,被醫(yī)生診斷為惡性結節(jié)并實施相應手術治療的患者中,實際惡性患者占比僅為63%。
4.2.2ROC圖
ROC(受試者工作特征)曲線常常用來檢查在找出真陽性和避免假陽性之間的權衡,曲線上的點表示不同假陽性閾值上的真陽性的比例。簡單來說,ROC曲線下面積越大,模型效果越好[14]。本次研究模型的ROC曲線則如圖3所示。
從圖3可以看出,ROC曲線距離完美情況比較接近,經計算也可得出AUC(ROC曲線下面積)為0.935,說明模型預測性能非常好。
4.3算法對比
為了驗證本算法的實際性能,本文選擇了3種常用的數據挖掘模型展開對比測試。實驗采用真實臨床醫(yī)療數據和UCI標準數據集new-thyroid分別進行分類預測效果對比,且各模型都選取最佳參數下的效果,對比結果如表2、表3所示。
從表2、表3中可以看出,本文提出的方法預測準確率較之前已有的研究方法均呈現(xiàn)有一定程度的提高,證明了本文算法的優(yōu)異之處,對于疾病的診斷預測研究有一定的幫助。
[BT4]5結束語
近年來,甲狀腺疾病、尤其是甲狀腺結節(jié)的診治醫(yī)療已然成為研究學界的一個重點課題。如何在臨床施診過程中能夠有效提高良惡性結節(jié)的診斷準確率,正確及時制定、推薦治療方案,無論對患者的病情進展控制還是對醫(yī)療資源的合理配置都將具有重要的意義。本文提出的改進的Boosting算法,在真實醫(yī)療數據集和UCI標準數據集上都呈現(xiàn)出一定的優(yōu)異性,具有較高的預測正確率。并且考慮到實際醫(yī)療數據的不平衡性和稀疏性,使結果更具說服力、及優(yōu)良可行性。
未來的工作主要從3個方向入手:首先,在更趨宏觀科學的指導下確定鑒別結節(jié)良惡性的特征屬性;考慮其他忽略的特征屬性對鑒別結果的影響。其次,提升特征屬性的質量;包括特征屬性的提取、轉換和選擇。最后,要重視算法的優(yōu)化,針對醫(yī)療數據的特征作出相應的模型優(yōu)化,讓算法對數據集分類的結果更具普適性和高效實用性。
[HS1*2][HT5H]參考文獻:[HT]
[WTBZ][ST6BZ][HT6SS][1] [ZK(#〗
[HJ*2]
[JP3]HAUGEN B R, ALEXANDER E K, BIBLE K C, et al. 2015 American Thyroid Association[JP] Management Guidelines forpatients with Thyroid Nodules and Differentiated Thyroid Cancer[J]. Thyroid, 2016, 26(1): 1-133.
[2]u權,郭茂祖,劉揚,等. 類別不平衡的分類方法及在生物信息學中的應用[J]. 計算機研究與發(fā)展, 2010,47(8):1407-1414.
[3] Masko D, Hensman P. The impact of imbalanced training data for convolutional neural networks[D]. Stockholm:KTH Royal Institute of Technology, 2015.
[4] LUSA L. Joint use of overand undersampling techniques and crossvalidation for the development and assessment of prediction models[J]. BMC bioinformatics, 2015, 16(1): 1-10.
[5]熊ィ龔勛,羅俊,等.基于局部紋理特征的超聲甲狀腺結節(jié)良惡性識別[J]. 數據采集與處理, 2015,30(1):186-191.
[6] MA J, LUO S, DIGHE M, et al. Differential diagnosis of thyroid nodules with ultrasound elastography based on support vector machines[C]// Ultrasonics Symposium (IUS), 2010 IEEE. San Diego, California, USA: IEEE, 2010:1372-1375.
[7] 李前程,孫麗娜,吳雙,等. 高頻超聲及彈性成像對甲狀腺結節(jié)性質鑒別診斷的logistic 回歸分析[J]. 中國地方病防治雜志, 2015,30(4):291-293.
[8] 張振宇. 改進集成技術在甲狀腺超聲圖像分類中的應用研究[D]. 保定:河北大學, 2014.
[9] 陳德華,馮潔瑩,樂嘉錦,等. 中文病理文本的結構化處理方法研究[J]. 計算機科學,2016,43(10):272-276.
[10] 戚ィ陳俊,李千目. 基于冗余消除和屬性數值化的XACML策略優(yōu)化方法[J]. 計算機科學,2016,43(2):163-168.
[11]Furuya S, Tominaga K, Miyazaki F, et al. Losing dexterity: patterns of impaired coordination of finger movements in musician's dystonia[EB/OL]. [2015-08-20]. http://sci Rep.2015;5:13360.
[12]Chen T, Guestrin C. XGBoost: A Scalable Tree Boosting System[EB/OL]. [2016-03-09].https:///pdf/1603.02754v1.pdf.