<dfn id="w48us"></dfn><ul id="w48us"></ul>
  • <ul id="w48us"></ul>
  • <del id="w48us"></del>
    <ul id="w48us"></ul>
  • 卡方技術(shù)在企業(yè)搜索引擎角色信息分析中的運(yùn)用論文

    時(shí)間:2024-06-14 20:20:45 其他類論文 我要投稿

    卡方技術(shù)在企業(yè)搜索引擎角色信息分析中的運(yùn)用論文

      對于少于 1 000 人的企業(yè)單位,60% 的員工認(rèn)為在企業(yè)信息化平臺(tái)中找到自己想要的數(shù)據(jù)是非常困難的。

    卡方技術(shù)在企業(yè)搜索引擎角色信息分析中的運(yùn)用論文

      而在公司人數(shù)超過 1 000 人的情況下,認(rèn)為獲取不到自己想要數(shù)據(jù)的員工竟然達(dá)到公司人數(shù)的 77%.因此,企業(yè)的規(guī)模越大,企業(yè)的人數(shù)越多,企業(yè)信息化平臺(tái)中產(chǎn)生的數(shù)據(jù)量就越多,員工查找信息就更加困難。根據(jù)調(diào)查顯示,對于少于 1 000 人的企業(yè)里,有 67% 的員工認(rèn)為找到所需的信息對企業(yè)的發(fā)展是有影響的,而對于多于 1 000 人的企業(yè)中,這個(gè)數(shù)字竟然高達(dá) 89%.在大中型企業(yè)中,每天有 70% 的員工耗費(fèi) 1 ~ 2 小時(shí)來查找所需要的信息,加大了企業(yè)的成本,尤其是用戶想要查看已經(jīng)離職員工之前記錄的信息,由于人員已經(jīng)離開,想要查找對應(yīng)信息的難度加大,搜索耗費(fèi)的時(shí)間就更長。

      傳統(tǒng)企業(yè)搜索引擎雖然在一定程度上已經(jīng)解決該問題。然而,不同角色的用戶有著不同的需求,例如,財(cái)務(wù)角色的用戶和銷售角色的用戶對于相同的查詢詞會(huì)有不同的需求。本文提出采用卡方的方法進(jìn)行角色信息的分析,使不同角色的用戶雖采用相同的查詢詞,但得到與其角色更相關(guān)的信息。

      1 基于卡方的角色分析理論

      企業(yè)內(nèi)部每個(gè)用戶在不同系統(tǒng)中的職位不一樣,對于相同角色下的用戶,偏好可能相同,如角色 A 下的用戶關(guān)注財(cái)務(wù)信息,經(jīng)常搜索和點(diǎn)擊財(cái)務(wù)方面的數(shù)據(jù)。當(dāng)角色 A 下的其他用戶搜索時(shí),如果查詢詞跟 A 輸入的查詢詞相關(guān)時(shí),根據(jù) LUCENE,獲取文檔應(yīng)排在后面,但根據(jù)角色信息,角色 A 下的用戶點(diǎn)擊過多的文檔應(yīng)排在前面,這樣就隱含地為用戶推送了相關(guān)文檔。針對這個(gè)可能性,進(jìn)行角色分析。【1】

      其中,N 是一個(gè)定值,系統(tǒng)的數(shù)據(jù)條目數(shù);A 代表在某角色中文檔包含該詞的篇數(shù);B 代表在該角色中文檔沒有包含該詞的篇數(shù);C 代表的是不在該角色下有多少篇文檔包含該詞;D 代表的是不在該角色下有多少篇文檔沒有包含該詞;而 A+C 是一個(gè)定值,B+D 也是一個(gè)定值,因此公式(1)可以簡化,如下所示:【2】

      2 基于卡方的角色分析理論算法過程

      因?yàn)槠髽I(yè)中有多個(gè)系統(tǒng),分系統(tǒng)考慮,統(tǒng)計(jì)一個(gè)系統(tǒng)下所有角色對應(yīng)的特征詞。

      第一步獲取某系統(tǒng)下的所有數(shù)據(jù),獲取文檔對應(yīng)的用戶以及角色,并對正文部分進(jìn)行分詞。

      第二步獲取角色 A 在該系統(tǒng)下的所有數(shù)據(jù)并分詞。

      第三步對角色 A 下的每個(gè)詞 T,統(tǒng)計(jì)詞 T 在該角色下出現(xiàn)的樣本頻率,獲取詞 T 在該角色中沒有出現(xiàn)的樣本頻率,獲取詞 T 不在該角色下出現(xiàn)的樣本頻率,獲取詞 T 不在該角色下沒有出現(xiàn)的樣本頻率。

      第四步,根據(jù)公式(2)計(jì)算該系統(tǒng)下角色 A 中詞T 的權(quán)重;獲取每個(gè)系統(tǒng)下的每個(gè)角色對應(yīng)的特征詞,并保存。

      第五步獲取用戶所能訪問系統(tǒng)中角色對應(yīng)的特征詞,并根據(jù)特征詞進(jìn)行全文檢索,獲取排名前300的文檔。

      當(dāng)獲取某系統(tǒng)下角色 A 權(quán)重最大的 10 個(gè)詞時(shí),需考慮特征詞在該系統(tǒng)下所有角色中出現(xiàn)的次數(shù),如果次數(shù)大于角色個(gè)數(shù)的一個(gè)比值時(shí),則這樣的詞排除掉,因?yàn)檫@樣的詞不具有特性。

      當(dāng)用戶查詢時(shí),根據(jù)輸入查詢詞,得到搜索結(jié)果,分析前 300 篇文檔中是否包含該文檔,如果包含,則將文檔的分?jǐn)?shù)提高。

      3 結(jié) 語

      針對目前企業(yè)搜索中存在的問題,不同角色的用戶有著不同的需求,本文提出基于卡方的角色分析方法,使不同角色的用戶雖采用相同的查詢詞,但得到與其角色更相關(guān)的信息。該方法已經(jīng)應(yīng)用在實(shí)際平臺(tái)中,進(jìn)一步證明了該方法的有效性。

      參考文獻(xiàn)

      [1] 吳慶濤 . 個(gè)性化搜索引擎中的用戶興趣模型分析與研究 [J]. 研究與開發(fā) ,2010(10)。

      [2] 李紹華 , 高文宇 . 搜索引擎頁面排序算法研究綜述 [J]. 計(jì)算機(jī)應(yīng)用研究 ,2007(24)。

    【卡方技術(shù)在企業(yè)搜索引擎角色信息分析中的運(yùn)用論文】相關(guān)文章:

    財(cái)務(wù)分析在企業(yè)中的運(yùn)用研究論文05-22

    分析共好理念在企業(yè)團(tuán)隊(duì)管理中的運(yùn)用論文05-02

    企業(yè)專利信息管理與運(yùn)用論文02-21

    信息技術(shù)在電力企業(yè)中的應(yīng)用論文02-20

    傳統(tǒng)紋樣在現(xiàn)代設(shè)計(jì)中的運(yùn)用分析論文05-12

    信息技術(shù)在作文教學(xué)的運(yùn)用論文04-21

    水文勘測技術(shù)在水污染環(huán)境地質(zhì)中的運(yùn)用分析論文03-09

    目標(biāo)管理在企業(yè)管理中運(yùn)用分析11-14

    管理會(huì)計(jì)在企業(yè)中的運(yùn)用狀況調(diào)查與分析論文02-21

    • 相關(guān)推薦
    主站蜘蛛池模板: 国产精品内射视频免费| 精品偷自拍另类在线观看丰满白嫩大屁股ass | 2022免费国产精品福利在线| 无码精品人妻一区| 国产精品热久久毛片| 秋霞午夜鲁丝片午夜精品久| 精品久久久久久无码专区| 亚洲七七久久精品中文国产| 国产精品一区三区| 99爱在线视频这里只有精品| 国产高清在线精品一区| 久久精品亚洲一区二区三区浴池 | 日韩精品久久久久久免费| 欧美精品免费专区在线观看| 国产精品爽爽ⅴa在线观看| 欧美精品福利视频| 国产成人精品一区二区三区免费| 亚洲精品无码久久久久sm| 日韩精品成人亚洲专区| 精品国精品国产自在久国产应用男| 日本欧美韩国日本精品| 国产在线不卡午夜精品2021| 国产AV国片精品有毛| 精品无码AV无码免费专区| 性欧洲精品videos| 宅男在线国产精品无码| 亚洲国产av无码精品| 四虎精品影库4HUTV四虎| 久久91这里精品国产2020| 国产一在线精品一区在线观看| 国产精品自在线拍国产第一页| 国产精品无码不卡一区二区三区| 国产精品福利在线观看免费不卡| 99久久国产综合精品成人影院| 99久久国产主播综合精品| 国产高清在线精品一区二区三区 | 国产欧美亚洲精品A| 精品无码国产污污污免费网站| 国产欧美精品AAAAAA片| 国产精品夜色一区二区三区| 欧美精品亚洲精品日韩|