大丰收一尾中特:一種用戶畫像方法、裝置、可讀存儲介質及終端設備制造方法及圖紙

技術編號:21185432 閱讀:163 留言:0更新日期:2019-05-22 16:03
本發明專利技術屬于計算機技術領域,尤其涉及一種用戶畫像方法、裝置、計算機可讀存儲介質及終端設備。所述方法獲取用戶在預設的各個評估維度上的特征信息,并根據所述特征信息構造所述用戶的特征向量;將所述用戶的特征向量輸入到預設的分類器序列中進行處理,得到所述用戶的標簽向量。其中的各個分類器的排列順序在訓練過程中依次逐個確定,每個分類器用于確定一個標簽維度上的標簽值,通過這樣的方式,排列順序在前的分類器對用戶的特征向量的處理結果會傳遞到排列順序在后的分類器中,并參與到排列順序在后的分類器的處理過程之中,從而將各個分類器有機的耦合在一起,充分利用了這些分類器之間的關聯性,大大提升了用戶畫像的準確率。

A User Portrait Method, Device, Readable Storage Media and Terminal Equipment

572222一尾中特平 www.fbmtd.icu The invention belongs to the field of computer technology, in particular to a user portrait method, device, computer readable storage medium and terminal equipment. The method obtains the user's feature information on each preset evaluation dimension and constructs the user's feature vector according to the feature information. The user's feature vector is input into the preset classifier sequence for processing, and the label vector of the user is obtained. The ranking order of each classifier is determined one by one in the training process. Each classifier is used to determine the label value on a label dimension. In this way, the results of the processing of user's eigenvectors by the former classifier will be transmitted to the latter classifier, and participate in the processing of the latter classifier. Thus, each classifier is organically coupled together, making full use of the correlation between these classifiers, which greatly improves the accuracy of user portraits.

【技術實現步驟摘要】
一種用戶畫像方法、裝置、可讀存儲介質及終端設備
本專利技術屬于計算機
,尤其涉及一種用戶畫像方法、裝置、計算機可讀存儲介質及終端設備。
技術介紹
隨著互聯網的普及與發展,越來越多的數據可以被各個互聯網運營商收集起來。例如,對于電商網站,可以獲得用戶的購買記錄、瀏覽記錄等信息;對于搜索引擎,可以獲得用戶的搜索記錄、點擊記錄等信息。為了更好的利用這樣的信息,以提供更為高效優質的服務,用戶畫像這一技術得到了普遍重視。用戶畫像是根據用戶社會屬性、生活習慣和消費行為等信息而抽象出的一個標簽化的用戶模型。但是,目前的用戶畫像一般都是針對單一的標簽進行的,然而,在很多實際場景中,一個用戶可能同時具有多個不同維度的標簽。針對這種多標簽的場景,現有技術一般會將各個不同的標簽維度獨立進行處理,分別在各個標簽維度上進行用戶畫像,這種方式未能充分考慮到各個標簽維度之間的關聯性,往往導致用戶畫像的準確率較低。
技術實現思路
有鑒于此,本專利技術實施例提供了一種用戶畫像方法、裝置、計算機可讀存儲介質及終端設備,以解決現有技術一般會將各個不同的標簽維度獨立進行處理,導致用戶畫像的準確率較低的問題。本專利技術實施例的第一方面提供了一種用戶畫像方法,可以包括:獲取用戶在預設的各個評估維度上的特征信息,并根據所述特征信息構造所述用戶的特征向量;將所述用戶的特征向量輸入到預設的分類器序列中進行處理,得到所述用戶的標簽向量,其中,所述分類器序列中包括兩個以上的不同分類器,且各個分類器的排列順序在訓練過程中依次逐個確定,所述標簽向量包括兩個以上的標簽維度上的標簽值,每個分類器用于確定一個標簽維度上的標簽值。本專利技術實施例的第二方面提供了一種用戶畫像裝置,可以包括:特征向量構造???,用于獲取用戶在預設的各個評估維度上的特征信息,并根據所述特征信息構造所述用戶的特征向量;分類器處理???,用于將所述用戶的特征向量輸入到預設的分類器序列中進行處理,得到所述用戶的標簽向量,其中,所述分類器序列中包括兩個以上的不同分類器,且各個分類器的排列順序在訓練過程中依次逐個確定,所述標簽向量包括兩個以上的標簽維度上的標簽值,每個分類器用于確定一個標簽維度上的標簽值。本專利技術實施例的第三方面提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機可讀指令,所述計算機可讀指令被處理器執行時實現如下步驟:獲取用戶在預設的各個評估維度上的特征信息,并根據所述特征信息構造所述用戶的特征向量;將所述用戶的特征向量輸入到預設的分類器序列中進行處理,得到所述用戶的標簽向量,其中,所述分類器序列中包括兩個以上的不同分類器,且各個分類器的排列順序在訓練過程中依次逐個確定,所述標簽向量包括兩個以上的標簽維度上的標簽值,每個分類器用于確定一個標簽維度上的標簽值。本專利技術實施例的第四方面提供了一種終端設備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機可讀指令,所述處理器執行所述計算機可讀指令時實現如下步驟:獲取用戶在預設的各個評估維度上的特征信息,并根據所述特征信息構造所述用戶的特征向量;將所述用戶的特征向量輸入到預設的分類器序列中進行處理,得到所述用戶的標簽向量,其中,所述分類器序列中包括兩個以上的不同分類器,且各個分類器的排列順序在訓練過程中依次逐個確定,所述標簽向量包括兩個以上的標簽維度上的標簽值,每個分類器用于確定一個標簽維度上的標簽值。本專利技術實施例與現有技術相比存在的有益效果是:本專利技術實施例預先構造出一個分類器序列,其中的各個分類器的排列順序在訓練過程中依次逐個確定,每個分類器用于確定一個標簽維度上的標簽值,通過這樣的方式,排列順序在前的分類器對用戶的特征向量的處理結果會傳遞到排列順序在后的分類器中,并參與到排列順序在后的分類器的處理過程之中,從而將各個分類器有機的耦合在一起,充分利用了這些分類器之間的關聯性,大大提升了用戶畫像的準確率。附圖說明為了更清楚地說明本專利技術實施例中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本專利技術的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其它的附圖。圖1為本專利技術實施例中一種用戶畫像方法的一個實施例流程圖;圖2為分類器序列的構造過程的示意流程圖;圖3為各個分類器之間的網狀拓撲結構的示意圖;圖4為在網狀拓撲結構中的優選路徑的示意圖;圖5為使用訓練樣本集合對分類器集合中的各個分類器進行的訓練過程的示意流程圖;圖6為構造出的分類器序列的示意圖;圖7為優選路徑的確定過程的示意流程圖;圖8為本專利技術實施例中一種用戶畫像裝置的一個實施例結構圖;圖9為本專利技術實施例中一種終端設備的示意框圖。具體實施方式為使得本專利技術的專利技術目的、特征、優點能夠更加的明顯和易懂,下面將結合本專利技術實施例中的附圖,對本專利技術實施例中的技術方案進行清楚、完整地描述,顯然,下面所描述的實施例僅僅是本專利技術一部分實施例,而非全部的實施例?;詒咀ɡ際踔械氖凳├?,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其它實施例,都屬于本專利技術?;さ姆段?。請參閱圖1,本專利技術實施例中一種用戶畫像方法的一個實施例可以包括:步驟S101、獲取用戶在預設的各個評估維度上的特征信息,并根據所述特征信息構造所述用戶的特征向量。具體的評估維度可以根據實際情況進行設置,例如,若要判斷用戶對某些產品的購買意向,則所需的評估維度包括但不限于性別信息、年齡信息、受教育程度信息、收入水平信息、工作種類信息等等。由于上述各個評估維度上的特征信息并不是數值化的信息,不利于進行分析計算,因此,需要首先對各個維度的信息進行數值化處理。例如,對于性別信息這一評估維度而言,若性別為男性,則可將該評估維度的取值數值化為1,若性別為女性,則可將該評估維度的取值數值化為0;對于年齡這一評估維度而言,若年齡為20歲以下,則可將該評估維度的取值數值化為0,若年齡為20歲至40歲,則可將該評估維度的取值數值化為1,若年齡為40歲至60歲,則可將該評估維度的取值數值化為2,若年齡為60歲以上,則可將該評估維度的取值數值化為3;對于受教育程度這一評估維度而言,若受教育程度為高中及高中以下,則可將該評估維度的取值數值化為0,若受教育程度為本科,則可將該評估維度的取值數值化為1,若受教育程度為碩士研究生,則可將該評估維度的取值數值化為2,若受教育程度為博士研究生及以上,則可將該評估維度的取值數值化為3;其它各個評估維度的數值化處理過程與之類似,此處不再贅述。需要注意的是,以上的數值化處理過程只是一種可能的數值化處理方式,還可以根據實際情況進行其它類似的數值化處理,此處不對其做具體限制。在進行完數值化處理之后,則可將各個評估維度上的特征信息構造為如下所示的特征向量:EigenVec=(EigenVal1,EigenVal2,...,EigenValen,...,EigenValEN)其中,EigenVec為所述用戶的特征向量,EigenValen為所述用戶的特征向量在第en個評估維度上的特征信息,1≤en≤EN,EN為評估維度的總數。步驟S102、將所述用戶的特征向量輸入到預設的分類器序列中進行處理,得到所述用戶的標簽向量。所本文檔來自技高網...

【技術?;さ恪?/strong>
1.一種用戶畫像方法,其特征在于,包括:獲取用戶在預設的各個評估維度上的特征信息,并根據所述特征信息構造所述用戶的特征向量;將所述用戶的特征向量輸入到預設的分類器序列中進行處理,得到所述用戶的標簽向量,其中,所述分類器序列中包括兩個以上的不同分類器,且各個分類器的排列順序在訓練過程中依次逐個確定,所述標簽向量包括兩個以上的標簽維度上的標簽值,每個分類器用于確定一個標簽維度上的標簽值。

【技術特征摘要】
1.一種用戶畫像方法,其特征在于,包括:獲取用戶在預設的各個評估維度上的特征信息,并根據所述特征信息構造所述用戶的特征向量;將所述用戶的特征向量輸入到預設的分類器序列中進行處理,得到所述用戶的標簽向量,其中,所述分類器序列中包括兩個以上的不同分類器,且各個分類器的排列順序在訓練過程中依次逐個確定,所述標簽向量包括兩個以上的標簽維度上的標簽值,每個分類器用于確定一個標簽維度上的標簽值。2.根據權利要求1所述的用戶畫像方法,其特征在于,所述分類器序列的構造過程包括:從預設的歷史用戶信息數據庫中選取N個訓練樣本,并組成訓練樣本集合,N為正整數;使用所述訓練樣本集合對預設的分類器集合中的各個分類器進行LN-1輪訓練,每輪訓練從所述分類器集合中篩選出一個分類器,LN為標簽維度的總數;將所述分類器集合中的各個分類器按照篩選出的先后順序構造成所述分類器序列。3.根據權利要求2所述的用戶畫像方法,其特征在于,所述訓練樣本集合中的每個訓練樣本均包括一個歷史用戶的特征向量和標簽向量,即:Samplen=(EigenVecn,LabelVecn)其中,Samplen為所述訓練樣本集合中的第n個訓練樣本,1≤n≤N,EigenVecn為第n個訓練樣本的特征向量,且:EigenVecn=(EigenValn,1,EigenValn,2,...,EigenValn,en,...,EigenValn,EN),EigenValn,en為第n個訓練樣本的特征向量在第en個評估維度上的特征信息,1≤en≤EN,EN為評估維度的總數,LabelVecn為第n個訓練樣本的標簽向量,且:LabelVecn=(LabelValn,1,LabelValn,2,...,LabelValn,ln,...,LabelValn,LN),LabelValn,ln為第n個訓練樣本的標簽向量在第ln個標簽維度上的標簽值,1≤ln≤LN。4.根據權利要求3所述的用戶畫像方法,其特征在于,使用所述訓練樣本集合對所述分類器集合中的各個分類器進行的第t輪訓練過程包括:根據下式對所述訓練樣本集合的各個訓練樣本的特征向量進行擴展:ExEigenVect,n=(ExEigenVect-1,n,SelLabelValt-1,n)其中,ExEigenVect,n為第n個訓練樣本在第t輪訓練過程中擴展得到的特征向量,1≤t≤LN-1,特殊地,設置ExEigenVec0,n=EigenVecn,SelLabelValt,n為第n個訓練樣本與第t輪訓練過程中篩選出的分類器對應的標簽值,特殊地,設置從所述分類器集合中分別提取出各個待篩選的分類器,其中,待篩選的分類器的總數為SNt,且SNt=LN-t+1;使用所述訓練樣本集合分別對各個待篩選的分類器進行訓練,其中,分類器的輸入為所述訓練樣本集合中各個訓練樣本擴展得到的特征向量,輸出為預測標簽值;根據所述訓練樣本集合中各個訓練樣本的預測標簽值分別計算各個待篩選的分類器的分類精準度;選取分類精準度最高的分類器作為第t輪訓練過程中篩選出的分類器。5.根據權利要求4所述的用戶畫像方法,其特征在于,所述根據所述訓練樣本集合中各個訓練樣本的預測標簽值分別計算各個待篩選的分類器的分類精準度包括:根據下式分別計算各個待篩選的分類器的分類精準度:或:其中,為第n個訓練樣本在第t輪訓練過程中與第snt個待篩選的分類器對應的標簽值,1≤snt≤SNt,為第n個訓練樣本在第t輪訓練過程中經第snt個待篩選的分類器處理得到的預測標簽值,為第t輪訓練過程中待篩選的第snt個分類器的分類精準度。6.一種用戶畫像...

【專利技術屬性】
技術研發人員:趙付利,劉建華,
申請(專利權)人:平安科技深圳有限公司,
類型:發明
國別省市:廣東,44

網友詢問留言 已有0條評論
  • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

1
彩票双面盘1.998 后三组选组选包胆 雪缘园即时比分直播 天津时时下载手机版 扑克牌算命 二八杠抓牌顺口溜 pk10助赢软件手机版 欢乐雀神麻将下载 四川时时诈骗案 时时彩倍投表图 北京塞车计划网全天更新 pk10长期稳赚8码技巧 联众麻将下载 七乐彩开奖结果 牛牛看4张牌抢庄老是输 欢乐炸金花手机版下载