前言:想要寫出一篇引人入勝的文章?我們特意為您整理了科技期刊中學(xué)術(shù)畫像的應(yīng)用范文,希望能給你帶來靈感和參考,敬請閱讀。
[摘要]為了加速邁向互聯(lián)智能時代,科技期刊將學(xué)術(shù)畫像這一概念引入出版流程。文章闡述了學(xué)術(shù)畫像的定義和分類,介紹了學(xué)術(shù)畫像的構(gòu)建及技術(shù)、平臺支持情況,分析了學(xué)術(shù)畫像如何優(yōu)化傳統(tǒng)出版流程,剖析了目前將學(xué)術(shù)畫像在科技期刊中應(yīng)用存在的問題。盡管學(xué)術(shù)畫像在出版領(lǐng)域的應(yīng)用仍處于初步應(yīng)用期,但新技術(shù)中蘊含的強大生機勢必為科技期刊的發(fā)展帶來新的可能性。
[關(guān)鍵詞]學(xué)術(shù)畫像;人工智能;大數(shù)據(jù);圖譜技術(shù);科技期刊
學(xué)術(shù)畫像源于用戶畫像。用戶畫像是將用戶的屬性、行為與期望聯(lián)結(jié)起來的實際用戶的虛擬代表,屬于計算社會科學(xué)的范疇,最早應(yīng)用于電商領(lǐng)域,它使產(chǎn)品的服務(wù)對象更加聚焦、更加專注。關(guān)于用戶畫像的研究最早可追溯到1999年,在PeopleGarden:CreatingDataPortraitsforUsers[1]一文中出現(xiàn)了“用戶畫像”一詞,作者指出在線交互環(huán)境中存在大量用戶,為了更加有效地進行在線交互、了解其他參與者、了解它如何隨時間變化,引入根據(jù)用戶交互行為形成的“數(shù)據(jù)畫像”概念。近幾年,以大數(shù)據(jù)技術(shù)、人工智能、機器人技術(shù)等為突破口的第四次科技革命蓬勃興起,使得數(shù)據(jù)分析更為深入與智能化,機器學(xué)習(xí)和深入學(xué)習(xí)成為構(gòu)建用戶畫像的主流技術(shù)[2]。伴隨著科學(xué)研究的迅猛發(fā)展,科技投入不斷加大,科研成果呈爆發(fā)式增長,學(xué)術(shù)數(shù)據(jù)呈現(xiàn)指數(shù)增長趨勢。這些海量的學(xué)術(shù)數(shù)據(jù)蘊藏著巨大的科研價值,值得整個學(xué)術(shù)界關(guān)注。學(xué)術(shù)大數(shù)據(jù)(ScholarlyBigData,SBD)包括學(xué)者數(shù)據(jù)、論文數(shù)據(jù)、期刊會議數(shù)據(jù)以及其間的關(guān)聯(lián)信息等,它可定義為通過科研活動產(chǎn)生的海量文獻(xiàn)和學(xué)者數(shù)據(jù)[3],以這些大數(shù)據(jù)為基礎(chǔ),可繪制更為清晰準(zhǔn)確的學(xué)術(shù)畫像。目前,關(guān)于學(xué)術(shù)畫像的研究仍主要為畫像技術(shù)層面,應(yīng)用層面的研究主要集中在圖書館領(lǐng)域,出版業(yè)中的實踐仍然較少。學(xué)術(shù)畫像在期刊出版領(lǐng)域的研究仍處于萌芽期,但這種技術(shù)變革帶來的巨大發(fā)展正在醞釀中,必將為學(xué)術(shù)交流注入新的活力。
一、學(xué)術(shù)畫像的定義及分類
學(xué)術(shù)畫像是指用數(shù)字化的方式對學(xué)術(shù)對象進行形象化的描述所形成的具體化的表達(dá),利用這一表達(dá)為特定用戶提供有針對性的服務(wù)。學(xué)術(shù)畫像通常利用網(wǎng)絡(luò)爬蟲獲取互聯(lián)網(wǎng)中的大量學(xué)術(shù)數(shù)據(jù),包括文獻(xiàn)信息、讀者信息、學(xué)者信息、期刊信息等,采用基于深度語義學(xué)習(xí)的實體識別技術(shù)、關(guān)系抽取技術(shù)和屬性抽取技術(shù)等對多源用戶信息進行抽取,再利用基于跨模態(tài)共享子空間學(xué)習(xí)理論的知識融合技術(shù),實現(xiàn)跨模態(tài)、跨領(lǐng)域的學(xué)術(shù)信息融合,構(gòu)建學(xué)科畫像、學(xué)者畫像、期刊畫像、基金畫像、科研機構(gòu)畫像、學(xué)術(shù)團體畫像、學(xué)術(shù)會議畫像、個人用戶畫像等(見圖1)。學(xué)術(shù)畫像的概念與用戶畫像不同之處在于,它是一個統(tǒng)稱,包含的信息更為豐富,因此在科技期刊中的應(yīng)用也更為廣泛。如學(xué)科畫像包括學(xué)科結(jié)構(gòu)、研究動態(tài)、學(xué)科關(guān)聯(lián)與輻射、代表人物、代表成果等;學(xué)者畫像包括基本信息、研究領(lǐng)域、學(xué)術(shù)影響力、學(xué)術(shù)成果、合作關(guān)系網(wǎng)等;期刊畫像又可以細(xì)分為面向作者的期刊畫像和面向讀者的期刊畫像,因需求不同,所展示的信息側(cè)重點也不同。除圖1中所列學(xué)術(shù)畫像的分類,中國知網(wǎng)針對學(xué)術(shù)期刊還有作者畫像、審稿專家畫像等。
二、學(xué)術(shù)畫像的構(gòu)建
學(xué)術(shù)畫像的構(gòu)建主要包括信息采集與抽取、信息融合形成便簽、構(gòu)建畫像幾個部分。學(xué)者畫像是學(xué)術(shù)畫像中研究最早也是研究最為深入的領(lǐng)域,故本文以學(xué)者畫像的構(gòu)建為主進行闡述。
(一)學(xué)者畫像構(gòu)建流程創(chuàng)建學(xué)者畫像需要三步:第一步,基本信息的采集、清洗。學(xué)者畫像的信息一般采集于互聯(lián)網(wǎng)或各大數(shù)據(jù)庫,可利用Python采集相關(guān)信息,并對海量數(shù)據(jù)進行結(jié)構(gòu)化處理。構(gòu)建學(xué)者畫像抽取的重點信息包括工作單位、職務(wù)職稱、研究領(lǐng)域、學(xué)術(shù)成果、合作關(guān)系、文獻(xiàn)引用等。第二步,建立數(shù)據(jù)字段標(biāo)簽,將結(jié)構(gòu)化的數(shù)據(jù)歸類、聚合,統(tǒng)計分析、厘清邏輯關(guān)系,分配權(quán)重與構(gòu)建畫像體系。第三步,建立模型框架,完善學(xué)者畫像。學(xué)術(shù)畫像構(gòu)建的關(guān)鍵技術(shù)包括建立標(biāo)簽體系、提取模型以及關(guān)鍵算法。由于學(xué)者畫像具有多個維度,因此將其合理的標(biāo)簽化是關(guān)鍵問題之一,再結(jié)合權(quán)重可以將標(biāo)簽進行優(yōu)先級排序。
(二)平臺與技術(shù)支持技術(shù)是出版行業(yè)變革的觸媒和關(guān)鍵力量。雖然科技期刊本身可能欠缺這些新技術(shù)的積淀,但這已經(jīng)不再是制約科技期刊邁向人工智能時代的因素了。其原因在于,如騰訊、百度、阿里巴巴等IT業(yè)巨頭已投入大量人財物力將底層AI算法封裝,科技期刊只需要學(xué)會如何調(diào)用現(xiàn)成技術(shù)即可應(yīng)用到出版行業(yè)中;另外,還出現(xiàn)了為數(shù)眾多的學(xué)術(shù)期刊出版平臺技術(shù)服務(wù)商,它們?yōu)榭萍计诳q{護航。這些技術(shù)服務(wù)商既包括非出版領(lǐng)域服務(wù)商,又包括出版領(lǐng)域?qū)iT的服務(wù)商;它們的服務(wù)兼具免費服務(wù)和收費服務(wù)。目前,谷歌學(xué)術(shù)、微軟學(xué)術(shù)搜索、百度學(xué)術(shù)、搜狗學(xué)術(shù)等搜索引擎均提供學(xué)者畫像服務(wù),出版領(lǐng)域的技術(shù)服務(wù)商如Atpon、中國知網(wǎng)、AMiner等則為學(xué)術(shù)界量身定制了內(nèi)容更為豐富的學(xué)術(shù)畫像服務(wù),國際出版業(yè)巨頭如施普林格在其數(shù)字科學(xué)(DigitalScience)網(wǎng)站中也推出了學(xué)者畫像。在百度學(xué)術(shù)、中國知網(wǎng)、AMiner的學(xué)者畫像中可以看出,不同畫像均包含學(xué)者基本信息、學(xué)術(shù)影響力評估、興趣標(biāo)簽、合作關(guān)系和主要代表作等信息。相比之下,中國知網(wǎng)還提供了全部學(xué)術(shù)成果展示、所在領(lǐng)域研究現(xiàn)狀分析等,但查看其中部分內(nèi)容需要付費,其優(yōu)勢在于中國知網(wǎng)掌握了國內(nèi)海量的論文資源,而學(xué)術(shù)數(shù)據(jù)是繪制學(xué)術(shù)畫像的“燃料”,數(shù)據(jù)也是驅(qū)動人工智能取得更好的識別率和精準(zhǔn)度的核心因素。AMiner的畫像信息更為全面準(zhǔn)確,學(xué)者學(xué)術(shù)影響力評估采用雷達(dá)圖方式更為直觀,繪制了研究方向隨時間的變遷圖,學(xué)者畫像經(jīng)過人工校驗,將學(xué)者個人主頁、維基百科、社交平臺等眾多異構(gòu)化信息進行篩選合并,它的優(yōu)勢在于算法更為先進,采用在國際語義集成評測OAEI中連續(xù)七年獲獎的知識集成算法(RiMOM),信息抓取的精度更高。AMiner還為科技部的8萬名在庫專家構(gòu)建了專家畫像庫,為2016年以來的科技部重點項目推薦評審專家。除此之外,中國知網(wǎng)、AMiner等技術(shù)服務(wù)商還進行了學(xué)科畫像、期刊畫像、基金畫像、科研機構(gòu)畫像等方面的研究,為科技期刊應(yīng)用學(xué)術(shù)畫像優(yōu)化出版流程、完善知識服務(wù)等提供技術(shù)保障。
三、學(xué)術(shù)畫像在科技期刊中的應(yīng)用
在科技期刊的傳統(tǒng)出版流程中,無論是欄目的策劃、組稿,還是審稿專家的遴選、論文的傳播推送,都嚴(yán)重依賴編輯的個人經(jīng)驗和主觀判斷,這與科技迅猛發(fā)展的今天不相適應(yīng)。將學(xué)術(shù)畫像引入科技期刊出版流程中,從“經(jīng)驗判斷”轉(zhuǎn)向“數(shù)據(jù)分析”,能夠使科技期刊的發(fā)展更加高質(zhì)高效。
(一)利用學(xué)術(shù)畫像策劃欄目、籌劃新刊“對科研工作來講,科技期刊工作既是龍尾,又是龍頭。”盧嘉錫院士曾這樣高度概括科技期刊在整個科研工作中的重要作用??萍计诳莆罩鴦?chuàng)新科技成果的首發(fā)權(quán),但是面對層出不窮的科研新課題,科技期刊編輯往往無法準(zhǔn)確把握科研熱點和發(fā)展脈絡(luò),再依靠自己的經(jīng)驗進行選題策劃易有失偏頗。利用學(xué)術(shù)畫像可以找到優(yōu)勢學(xué)科和新興學(xué)科中的空白區(qū)域,進行新刊的策劃或調(diào)整現(xiàn)刊選題。通過學(xué)科畫像可以很好地定位學(xué)科發(fā)展動態(tài)、掌握學(xué)科結(jié)構(gòu)變化,通過期刊畫像可以了解同行競爭態(tài)勢和期刊市場需求,通過學(xué)者畫像可以掌握作者分布以及讀者分布,從而為科技期刊策劃欄目或策劃新刊提供數(shù)據(jù)支持。
(二)利用學(xué)術(shù)畫像組稿科技期刊的長足發(fā)展極大地依賴于優(yōu)秀作者的支持,反之將成為“無源之水、無本之木”。進行了充分的選題策劃后,編輯面臨的又一項任務(wù)便是尋找合適的作者完成論文的撰寫?!暗让紫洛仭钡慕M稿方式在科技期刊發(fā)展過程中所占比例逐漸下降,“找米下鍋”的組稿形式越來越受到重視,但也為科技期刊編輯設(shè)置了一道新難題:“米”從何處找?找到的“米”質(zhì)量是否符合要求?傳統(tǒng)工作流程中,組稿工作多是根據(jù)編輯所掌握的信息和個人經(jīng)驗篩選合適的撰稿人,這樣作出的選擇往往不夠全面和精確,工作效率也無法保障。而學(xué)術(shù)畫像可以提供全球數(shù)以億計的科研工作者的信息,讓編輯的“找米”之路不再迷茫。學(xué)者畫像在科技期刊組稿過程中能夠起到舉足輕重的作用,根據(jù)學(xué)者的興趣標(biāo)簽、科研成果等可以充分了解其科研進展,判斷是否為理想撰稿人。但在實際約稿過程中存在一種現(xiàn)象:某領(lǐng)域的著名學(xué)者有很強的學(xué)術(shù)影響力,往往一稿難求,這種情況下可以充分利用畫像中的合作關(guān)系網(wǎng),發(fā)掘其團隊中的中堅力量,使其成為自己的作者。另外,學(xué)科畫像、基金畫像、學(xué)術(shù)團體畫像都可以為精準(zhǔn)選擇撰稿人提供參考。
(三)利用學(xué)術(shù)畫像審稿同行評審環(huán)節(jié)是把控稿件質(zhì)量的重要一環(huán),但近年來各種因?qū)徃鍖?dǎo)致的學(xué)術(shù)論文被撤稿事件多有發(fā)生,究其根源在于作者推薦制度下的同行評審專家的選擇存在著漏洞和弊端,引起了學(xué)術(shù)界的廣泛關(guān)注。另外,越來越多的跨學(xué)科領(lǐng)域成為科研的熱點,這又為編輯在審稿專家的選擇上帶來了新的難題。既要有效規(guī)避作者推薦審稿專家的弊端,又要找到準(zhǔn)確的審稿專家,僅僅依靠編輯的經(jīng)驗判斷是很難實現(xiàn)的,而學(xué)術(shù)畫像可以輔助期刊編輯選擇合適的審稿專家。通過學(xué)者畫像可以發(fā)掘某領(lǐng)域?qū)W術(shù)影響力較大的專家學(xué)者,又可以檢驗作者推薦的審稿人是否真正是該領(lǐng)域的專家學(xué)者。利用學(xué)者畫像還可以輔助期刊審稿專家?guī)斓慕?,通過原有的學(xué)者畫像,再輔以一貫的審稿行為,形成期刊自己的審稿專家畫像[4]。
(四)利用學(xué)術(shù)畫像做傳播學(xué)術(shù)論文的傳播在傳統(tǒng)的出版流程中容易被忽視,但全媒體時代已不再是“酒香不怕巷子深”的時代了,科技期刊應(yīng)該充分利用各種傳播形式的優(yōu)勢,增強自身的曝光度,從而收獲更多的傳播份額。通過對比科技期刊目前使用的幾種主流傳播方式的優(yōu)缺點(見表1),我們可以清晰地認(rèn)識到利用學(xué)術(shù)畫像進行精準(zhǔn)推送的優(yōu)勢。目前,AMiner、騰云系統(tǒng)、Atpon技術(shù)服務(wù)公司等都推出了相應(yīng)的服務(wù),利用大數(shù)據(jù)和畫像技術(shù)助力科技期刊實現(xiàn)論文的精準(zhǔn)推送和跨學(xué)科擴散,找到潛在讀者群。
(五)利用畫像技術(shù)提供優(yōu)質(zhì)知識服務(wù)延長出版鏈條是科技期刊適應(yīng)全媒體時代的必要舉措,科技期刊除了擔(dān)負(fù)傳播科技信息的責(zé)任外,為讀者提供相應(yīng)的知識服務(wù)也是其重要使命。知識服務(wù)一詞最早源于圖書館研究,也是近些年圖書館學(xué)和情報學(xué)領(lǐng)域的研究熱點之一[5],關(guān)于科技期刊知識服務(wù)的研究剛開展不久。知識服務(wù)有別于信息服務(wù),它更注重用戶解決問題的需求,是將學(xué)術(shù)信息與服務(wù)緊密結(jié)合的一種服務(wù)模式[6]。目前,以各大數(shù)據(jù)庫面向個人及機構(gòu)用戶的知識服務(wù)為主,包括將文獻(xiàn)碎片化、概念圖譜化后,構(gòu)建相應(yīng)學(xué)科的“知識庫”,為讀者提供“學(xué)術(shù)趨勢搜索”“知識脈絡(luò)檢索”;利用學(xué)者畫像、期刊畫像等形成的“學(xué)術(shù)關(guān)注度檢索”;通過提取讀者相關(guān)信息,進行知識的智能推薦,等等。科技期刊一方面要做好與知識服務(wù)技術(shù)提供商的完美對接,另一方面要探索如何利用自身的資源優(yōu)勢進行知識服務(wù),提升科技期刊知識服務(wù)水平。
四、未來發(fā)展需解決的問題
目前,學(xué)術(shù)畫像在期刊出版領(lǐng)域的應(yīng)用仍十分有限,制約其廣泛應(yīng)用的因素主要包括以下幾個方面。一是技術(shù)匱乏。畫像對于計算機技術(shù)要求甚高,優(yōu)秀的人工智能算法是保證畫像精確度的重要因素之一,以深度學(xué)習(xí)為代表的人工智能算法為學(xué)術(shù)畫像的實現(xiàn)帶來了希望,只有先進的算法才能夠?qū)⒍嘣悩?gòu)的學(xué)術(shù)大數(shù)據(jù)進行整合,呈現(xiàn)精準(zhǔn)全面的學(xué)術(shù)畫像。但目前部分學(xué)術(shù)畫像的關(guān)鍵技術(shù)仍然掌握在少數(shù)人手里,且目前的算法仍然無法滿足需求。二是數(shù)據(jù)稀缺。數(shù)據(jù)可謂畫像技術(shù)的“燃料”,沒有數(shù)據(jù)便是“巧婦難為無米之炊”,數(shù)據(jù)是驅(qū)動人工智能取得更好識別率和精確度的核心因素。目前的學(xué)術(shù)大數(shù)據(jù)并非完全公開,國內(nèi)乃至全球的開放獲取期刊數(shù)量仍有待提高,一些大的出版集團和數(shù)據(jù)庫把持著大量未公開的學(xué)術(shù)數(shù)據(jù),制約了其他技術(shù)公司進行學(xué)術(shù)畫像的構(gòu)建。與此同時,學(xué)術(shù)數(shù)據(jù)變化頻繁,又為畫像的繪制增加了難度。三是規(guī)范性欠缺。以學(xué)者畫像為例,目前已出現(xiàn)多種版本的學(xué)者畫像,無論是信息的全面性還是涉及的信息類型都存在很大的差別。若相關(guān)的規(guī)范能夠及時出臺,將分布異構(gòu)的畫像信息進行整合,以規(guī)范化的形式呈現(xiàn)出來,將更有利于科研人員以及科技期刊使用。四是互聯(lián)網(wǎng)思維欠缺??萍计诳庉嫷墓ぷ髦匦耐€在欄目策劃、編輯校對方面,傳統(tǒng)出版思維固化嚴(yán)重,對于新技術(shù)的敏感度低,對于學(xué)術(shù)畫像的認(rèn)識模糊,沒有充分意識到“互聯(lián)網(wǎng)+”思維的重要性,導(dǎo)致科技期刊的參與感不足,直接制約學(xué)術(shù)畫像在科技期刊中的應(yīng)用。
五、結(jié)語
學(xué)術(shù)畫像在期刊出版領(lǐng)域還有更大的發(fā)展空間,目前仍處于初步應(yīng)用期,尚未出現(xiàn)改變整個期刊出版模式的作用,但是變革的力量已經(jīng)開始醞釀,加上技術(shù)升級和催化的新平臺的不斷涌現(xiàn),必將為學(xué)術(shù)交流注入新的活力,也為科技期刊出版帶來新的可能性和方向。
作者:王雅嬌 路佳 柯曉靜 單位:河北農(nóng)業(yè)大學(xué)期刊社