前言:想要寫出一篇引人入勝的文章?我們特意為您整理了科技信息服務(wù)人工智能技術(shù)應(yīng)用研究范文,希望能給你帶來靈感和參考,敬請閱讀。
互聯(lián)網(wǎng)為我們提供了取之不盡,用之不竭的公開信息資源寶庫,現(xiàn)代科技已廣泛應(yīng)用于科技信息服務(wù)領(lǐng)域,其中人工智能技術(shù)使科技信息工作流程的計(jì)算化、智能化特征更為顯著,因此,利用人工智能技術(shù)助推科技信息事業(yè)的發(fā)展成為必然選擇。本文對大數(shù)據(jù)下科技信息領(lǐng)域需要解決的主要問題,人工智能技術(shù)應(yīng)用于科技信息領(lǐng)域的研究的意義和主要研究內(nèi)容進(jìn)行了剖析和闡述,提出了相應(yīng)的研究觀點(diǎn)和技術(shù)路線圖,提出基于人工智能技術(shù)的科技政策動(dòng)態(tài)分析體系設(shè)計(jì)方案。并以科技信息的共享和利用為導(dǎo)向,開發(fā)和應(yīng)用科技信息資源,實(shí)現(xiàn)數(shù)據(jù)信息價(jià)值的最大化,通過人工智能技術(shù)進(jìn)行科技信息的深度領(lǐng)域數(shù)據(jù)分析服務(wù),實(shí)現(xiàn)科技信息資源的前沿性研究是大數(shù)據(jù)下科技信息的人工智能技術(shù)應(yīng)用的主要方向之一。大數(shù)據(jù)時(shí)代催生了海量數(shù)據(jù)的誕生,數(shù)據(jù)量的劇增一方面提供了更多信息來源,另一方面也給從更大量數(shù)據(jù)集中獲取有用信息制造了困擾。若要基于更全面客觀的數(shù)據(jù)獲得其準(zhǔn)確的信息,大量的非結(jié)構(gòu)化數(shù)據(jù)需要結(jié)構(gòu)化處理,才更便于分析,需要更長的時(shí)間和更高的人力成本。此外,互聯(lián)網(wǎng)環(huán)境下的信息傳遞瞬間即達(dá),對信息的即時(shí)性、保密性也提出了更高的要求。大數(shù)據(jù)時(shí)代的信息分析需求對傳統(tǒng)的信息分析方法提出了巨大的挑戰(zhàn)。伴隨公開和非公開的科技信息資源的日益增加,其數(shù)據(jù)已呈現(xiàn)和具備大數(shù)據(jù)的特點(diǎn),傳統(tǒng)的科技信息搜集和處理方法不足以應(yīng)付當(dāng)前的數(shù)據(jù)現(xiàn)狀。面對大數(shù)據(jù)時(shí)代日益增長和積累的龐大數(shù)據(jù)集,以及科技信息本身具有的學(xué)術(shù)價(jià)值和技術(shù)先進(jìn)性特質(zhì),使得面向科技信息領(lǐng)域的應(yīng)用研究工作必須做出變革,即以科技信息的處理和分析為導(dǎo)向,旨在實(shí)現(xiàn)科技信息資源的有效組織、處理和分析,實(shí)現(xiàn)需求驅(qū)動(dòng)的科技信息組織和分析方法的創(chuàng)新,為挖掘科技信息的前沿性研究服務(wù)。
大數(shù)據(jù)下科技信息領(lǐng)域需要解決的主要問題
(1)大數(shù)據(jù)下科技信息處理的標(biāo)準(zhǔn)化體系研究相比傳統(tǒng)的科技信息,大數(shù)據(jù)環(huán)境下的科技信息的來源、類型、內(nèi)容和數(shù)據(jù)格式更為復(fù)雜,制定和完善科技信息的標(biāo)準(zhǔn)化體系和內(nèi)容是及其必要的。信息資源的標(biāo)準(zhǔn)化體系是保證信息有效存儲(chǔ)、處理、分析和利用的基礎(chǔ)和前提。本文認(rèn)為將依據(jù)當(dāng)前科技信息現(xiàn)狀,針對具體領(lǐng)域研究和制定大數(shù)據(jù)下的科技信息處理規(guī)范和建議是必要的。(2)大數(shù)據(jù)下的科技信息資源的建設(shè)方法研究借助大數(shù)據(jù)技術(shù)可實(shí)現(xiàn)科技信息的大數(shù)據(jù)處理與大數(shù)據(jù)存儲(chǔ),實(shí)現(xiàn)多源異構(gòu)的科技信息完成數(shù)據(jù)的存儲(chǔ)、處理、交換等功能。大數(shù)據(jù)下的科技信息資源的建設(shè)方法研究需要從數(shù)據(jù)本身和數(shù)據(jù)的組織兩個(gè)研究視角出發(fā),分析梳理大數(shù)據(jù)環(huán)境下科技信息資源在建設(shè)中面臨的難點(diǎn)和關(guān)鍵性技術(shù)問題,研究和提出科技信息資源的知識(shí)組織系統(tǒng)框架和基本構(gòu)建方法。(3)大數(shù)據(jù)下的科技信息資源的分析方法研究結(jié)合科技大數(shù)據(jù)特點(diǎn),主要利用深度學(xué)習(xí)技術(shù)解決科技大數(shù)據(jù)的高維數(shù)據(jù)降維處理問題。研究和探索面向科技信息資源的分析方法,提出不同類型科技信息資源的關(guān)聯(lián)分析、重要性分析、主題演化路徑等深層次的信息分析方法和技術(shù),通過系列分析方法和技術(shù)研發(fā),解決科技信息資源管理工作中存在的問題,研究方法在實(shí)踐中進(jìn)行創(chuàng)新和發(fā)展。世界的發(fā)展、科技的換代、媒介的延伸以及人文的變更,匯聚成一股巨大的洪流,加速了我們所處時(shí)代的變換,人工智能技術(shù)已經(jīng)滲透到各個(gè)技術(shù)領(lǐng)域,以上問題涉及科技信息的組織和分析,需要人工智能技術(shù)的融合,即與人工智能技術(shù)的深度融合必將推動(dòng)科技信息進(jìn)入全新時(shí)代。
人工智能應(yīng)用于科技信息領(lǐng)域的研究意義和主要研究內(nèi)容
人工智能為解決科技信息的獲取和分析提供解決途徑(1)人工智能可拓展獲取科技信息的來源。從事智能分析的美國Stabilitas公司的首席運(yùn)營官ChrisHurst認(rèn)為:“人工智能可以擴(kuò)大信息工作的范圍,不會(huì)遺漏那些有價(jià)值的細(xì)節(jié)?!笨萍夹畔⑼瑯有枰ㄟ^各種渠道獲取世界各國的同類信息,利用分布式網(wǎng)絡(luò)爬蟲等人工智能技術(shù)可獲取全世界的開源信息,包括文本和音視頻數(shù)據(jù)。(2)人工智能可加快處理科技信息數(shù)據(jù)的速度。美國中央信息局肯特學(xué)校教信息分析的校長JosephGartin認(rèn)為:“梳理社交媒體來獲得信息并不是什么新鮮事,讓人耳目一新的是如今我們收集社交媒體數(shù)據(jù)的數(shù)量之大和速度之快。”海量的科技信息通過人工智能技術(shù)可以快速處理億萬比特的數(shù)據(jù),從而了解世界各國同類信息或事件,將每天接收到的大量數(shù)據(jù)轉(zhuǎn)變?yōu)槟軌蛴糜谡吆蛻?zhàn)場行動(dòng)的信息。(3)人工智能使科技信息的分析自動(dòng)化、智能化。據(jù)俄羅斯通訊社報(bào)道,俄羅斯總統(tǒng)普京表示:“無論誰在這一領(lǐng)域中處于領(lǐng)先地位,都將成為世界的統(tǒng)治者?!逼站┱J(rèn)為:人工智能是未來權(quán)力的關(guān)鍵。利用自然語言處理技術(shù)、語音識(shí)別、圖像檢索等人工智能技術(shù)可以極大的提高信息人員檢索有用信息的速度。此外,知識(shí)圖譜作為人工智能的知識(shí)庫基礎(chǔ),基于知識(shí)圖譜可實(shí)現(xiàn)分析對象的多維多步自動(dòng)關(guān)聯(lián)分析,利用深度學(xué)習(xí)模型可大大提高多因素影響的系統(tǒng)分析,獲得更好的信息分析效果。主要研究內(nèi)容(1)基于人工智能技術(shù)的科技信息的知識(shí)存儲(chǔ)和管理大數(shù)據(jù)下的科技信息具有海量、異構(gòu)、跨媒體的特點(diǎn),其知識(shí)存儲(chǔ)和管理需要對結(jié)構(gòu)化或非結(jié)構(gòu)化的跨模態(tài)數(shù)據(jù)進(jìn)行語義智能化計(jì)算研究,以為統(tǒng)一語義范疇下的數(shù)據(jù)查詢提供便捷的元數(shù)據(jù)服務(wù);對跨媒體知識(shí)統(tǒng)一組織進(jìn)行研究,為不同關(guān)系結(jié)構(gòu),不同模態(tài)數(shù)據(jù)的統(tǒng)一存儲(chǔ)與管理提供結(jié)構(gòu)基礎(chǔ);同時(shí),需要對跨媒體知識(shí)的更新進(jìn)行研究,為動(dòng)態(tài)的數(shù)據(jù)存儲(chǔ)與多變的業(yè)務(wù)管理提供支撐。最后,對跨媒體知識(shí)檢索與查詢進(jìn)行研究,從實(shí)際的檢索和查詢業(yè)務(wù)角度出發(fā),制定規(guī)則,優(yōu)化性能,提升知識(shí)數(shù)據(jù)被獲取時(shí)的準(zhǔn)確性與高效性。(2)基于人工智能技術(shù)的科技信息與知識(shí)的深度揭示與聚類加強(qiáng)科技信息資源的多源多模態(tài)數(shù)據(jù)整合關(guān)聯(lián)、信息抽取、不確定推理、機(jī)器學(xué)習(xí)、自然語言處理等人工智能技術(shù)研發(fā)與應(yīng)用;利用人工智能技術(shù)實(shí)現(xiàn)科技信息資源的外在層面的資源整合,資源內(nèi)在特征的深度聚合,實(shí)現(xiàn)科技信息與知識(shí)的深度揭示與聚類。通過可視化方式實(shí)現(xiàn)科技信息知識(shí)(研發(fā)技術(shù)、研發(fā)機(jī)構(gòu)、研發(fā)人員等)的聚合、揭示與展示。其中重點(diǎn)利用語義分析技術(shù)、詞表/本體構(gòu)建技術(shù)、知識(shí)圖譜技術(shù)、大數(shù)據(jù)分析等人工智能技術(shù),通過可視化方式實(shí)現(xiàn)科技信息知識(shí)的聚合、揭示與展示;實(shí)現(xiàn)對格式各異、內(nèi)容復(fù)雜的數(shù)字資源進(jìn)行深層次的揭示,從資源外在層面的資源整合,深入到資源內(nèi)在特征進(jìn)行深度聚合,實(shí)現(xiàn)信息與知識(shí)的深度揭示與聚類,同時(shí)將科技信息知識(shí)服務(wù)嵌入知識(shí)交流之中。技術(shù)路線圖如圖1所示。(2)基于人工智能技術(shù)的科技信息前沿技術(shù)發(fā)現(xiàn)與預(yù)警研究前沿技術(shù)發(fā)現(xiàn)與預(yù)警旨在有效指導(dǎo)和開展科技研究,國內(nèi)外已有研究在信息對象和研究方法上比較單一,信息價(jià)值和服務(wù)效果受限。科技信息前沿技術(shù)發(fā)現(xiàn)與預(yù)警研究應(yīng)更強(qiáng)調(diào)面向信息源的全面收集、處理、分析的一定程度智能化生產(chǎn)過程,更好的感知非完備信息,輔助信息用戶把不確定性預(yù)測變成更確定性預(yù)測。研究將不同類型的信息源進(jìn)行整合、融合,多維度的分析科技前沿技術(shù)特征,從不同角度實(shí)現(xiàn)有價(jià)值信息的綜合疊加和映射,從中發(fā)現(xiàn)、分析和描述科技前沿技術(shù)問題,為科技領(lǐng)域?qū)<覍?shí)現(xiàn)科技前沿的準(zhǔn)確辨識(shí)提供服務(wù),實(shí)現(xiàn)有效的技術(shù)預(yù)警。技術(shù)路線圖見圖2所示。
基于人工智能技術(shù)的科技政策動(dòng)態(tài)分析平臺(tái)設(shè)計(jì)
科技政策動(dòng)態(tài)分析脫離原有人工分析為主的模式,而借助技術(shù)手段進(jìn)行輔助分析是時(shí)展的必然趨勢,海量數(shù)據(jù)的現(xiàn)實(shí)對情報(bào)分析方法的沖擊不可避免。技術(shù)參與的目的是提高人工分析的效率和質(zhì)量,采用技術(shù)輔助手段是可以做到事半功倍的?;谌斯ぶ悄芗夹g(shù)的科技政策動(dòng)態(tài)分析平臺(tái)的目的在于如何利用技術(shù)手段提供獲取情報(bào)數(shù)據(jù)、情報(bào)多維分析能力和自動(dòng)生成可讀性的分析報(bào)告的能力,幫助提高人類思維的效率。1)科技政策動(dòng)態(tài)信息監(jiān)測科技政策動(dòng)態(tài)信息監(jiān)測主要采用網(wǎng)絡(luò)信息的監(jiān)測方式,只有在有效采集網(wǎng)絡(luò)信息的基礎(chǔ)上才能進(jìn)而實(shí)現(xiàn)具體內(nèi)容分析與信息服務(wù)。信息監(jiān)測是對互聯(lián)網(wǎng)上共享的科技政策資源進(jìn)行提取、解析、收集和存儲(chǔ)等的過程??萍颊邉?dòng)態(tài)信息監(jiān)測的一般框架可由圖3表示??萍颊邉?dòng)態(tài)信息監(jiān)測系統(tǒng)的層次模型:表示層,業(yè)務(wù)邏輯層和數(shù)據(jù)訪問層。數(shù)據(jù)訪問層:連接數(shù)據(jù)庫,執(zhí)行插入和查詢等操作。主要是用數(shù)據(jù)集訪問。業(yè)務(wù)邏輯層:調(diào)用數(shù)據(jù)訪問層的方法然后返回結(jié)果給表示層。表示層:獲取表單的數(shù)據(jù),然后調(diào)用業(yè)務(wù)邏輯層的方法處理數(shù)據(jù),然后根據(jù)結(jié)果顯示相應(yīng)的數(shù)據(jù)。科技政策動(dòng)態(tài)信息監(jiān)測的系統(tǒng)框架:系統(tǒng)分為數(shù)據(jù)層與應(yīng)用層兩個(gè)層次。其中,數(shù)據(jù)層為整個(gè)平臺(tái)提供數(shù)據(jù)支撐,包括監(jiān)測站點(diǎn)、情報(bào)、文章、等基礎(chǔ)信息數(shù)據(jù),以及用戶信息、日志信息等數(shù)據(jù)。應(yīng)用層主要提供站點(diǎn)管理、信息服務(wù)、編輯撰文三大功能模塊,為用戶使用系統(tǒng)進(jìn)行信息檢索、篩選、瀏覽、定制、撰文等提供服務(wù),同時(shí)也為管理員進(jìn)行系統(tǒng)管理、任務(wù)分配、成果組織等提供相應(yīng)接口。具體系統(tǒng)框架如圖4所示。
結(jié)語
在大數(shù)據(jù)環(huán)境下,科技信息的處理和分析涉及的數(shù)據(jù)更加復(fù)雜化,人工智能給科技信息處理和分析帶來了機(jī)遇和挑戰(zhàn),有效利用最新的人工智能技術(shù)能更好的為科技信息建設(shè)服務(wù)。ChrisHurst認(rèn)為:“人類的行為是數(shù)據(jù),而人工智能是數(shù)據(jù)模型。所以我們認(rèn)為人工智能在處理這些數(shù)據(jù)方面能夠比人類做得更好?!北疚奶岢隽嘶谌斯ぶ悄芗夹g(shù)的科技政策動(dòng)態(tài)分析平臺(tái)設(shè)計(jì)方案。并有以下幾方面未來工作的建議:(1)加強(qiáng)科技信息數(shù)據(jù)收集能力。充分利用爬蟲技術(shù)搜集開源情報(bào),并研究存儲(chǔ)整合技術(shù),為信息分析打下堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ);(2)加強(qiáng)多源多模態(tài)大數(shù)據(jù)整合關(guān)聯(lián)、信息抽取、不確定推理、機(jī)器學(xué)習(xí)、圖像識(shí)別、自然語言處理等人工智能技術(shù)研發(fā)與應(yīng)用;(3)構(gòu)建科技信息領(lǐng)域知識(shí)圖譜,加強(qiáng)信息分析、推理和挖掘的能力。
作者:于偉 王忠軍 單位:北方科技信息研究所