一尾中特免费公开资料:一種融合標簽信息的多標簽分類原型系統及方法技術方案

技術編號:21185430 閱讀:56 留言:0更新日期:2019-05-22 16:03
本發明專利技術涉及一種融合標簽信息的多標簽分類原型系統及方法。所述系統包括:一數據預處理???,用于對網絡中結構進行節點和邊的表示;一節點嵌入???,利用譜技術的方法將節點和節點屬性進行結合,構造網絡的相似矩陣;一標簽嵌入???,利用譜技術方法將網絡空間中的標簽信息進行表示學習,與已學習到的網絡嵌入的矩陣進行融合,得到節點向量表示;一分類結果輸出???,用分類函數得到節點最終的多標簽分類結果。本發明專利技術能夠將節點向量特征得分融入到現有的排序學習框架中進行分類,并按照順序輸出節點。

A Multi-label Classification Prototype System and Method Fusing Label Information

572222一尾中特平 www.fbmtd.icu The invention relates to a multi-label classification prototype system and a method for fusing label information. The system includes: a data preprocessing module for representing nodes and edges in the network structure; a node embedding module, which combines node and node attributes with spectral technology to construct a network similarity matrix; a label embedding module, which uses spectral technology to represent and learn label information in the network space, and embedding it into the network that has been learned. The fusion matrix is used to get the node vector representation, and a classification result output module is used to get the final multi-label classification results of the nodes. The invention can integrate the feature score of node vectors into the existing ranking learning framework for classification, and output nodes in order.

【技術實現步驟摘要】
一種融合標簽信息的多標簽分類原型系統及方法
本專利技術涉及一種融合標簽信息的多標簽分類原型系統及方法。
技術介紹
當前,有很多技術方法可用于網絡中節點的多標簽分類分析。傳統的多標簽分類算法是將多標簽學習問題轉換為多類(單標簽)分類問題。將訓練數據集中的標簽集合子集進行二進制編碼,每個編碼值看作是單標簽分類任務中的多類分類問題的不同類別值,然后,訓練多類分類器。當給定一個未知樣本時,首先根據訓練得到的多類分類器對其進行預測,然后將預測出的結果轉成二進制編碼,從而得到其所屬的類別標簽集合。這個方法比較簡單,但如果當標簽類別的數量很多時,將其轉換為新的類別標簽時值的數量會增加很多,從而導致這些類別標簽的訓練樣本不足以及訓練時間開銷大。當前,存在著一些基于網絡表示學習的多標簽分類分析方法?;誥卣筇卣饗蛄考撲?,通過計算關系矩陣的前k個特征向量或奇異向量來得到k維的節點表示。利用“非線性降維的全局幾何框架”計算出了全局最優解的Isomap算法。通過分析高維度的流行,從而找到與之對應的低緯度的嵌入,在計算高維度節點之間的距離時,提出了用實際輸入數據來估算其測地線距離的算法,代替了傳統的歐式距離,并保證了近似收斂到原始高維數據的真實結構。當前,還存在著一些基于隨機游走的多標簽分類分析方法。研究者將詞嵌入技術應用于網絡或圖節點的特征學習。通過實驗驗證了隨機游走序列中節點和文檔中的單詞一樣都遵從指數定律(power-law),從而進一步將著名的詞表示學習算法word2vec應用在隨機游走序列上,學習節點表示。
技術實現思路
本專利技術的目的在于提供一種融合標簽信息的多標簽分類原型系統及方法,通過利用譜技術將節點和節點屬性進行結合,從而得到網絡嵌入表示;接著將網絡空間中的標簽信息進行表示學習,將其映射成為向量,然后與已學習到的網絡嵌入的矩陣進行融合,最終得到節點的向量表示,改善網絡中節點的多標簽分類效果。為實現上述目的,本專利技術的技術方案是:一種融合標簽信息的多標簽分類原型系統,包括:一數據預處理???,用于對網絡中結構進行節點和邊的表示;一節點嵌入???,利用譜技術的方法將節點和節點屬性進行結合,構造網絡的相似矩陣;一標簽嵌入???,利用譜技術方法將網絡空間中的標簽信息進行表示學習,與已學習到的網絡嵌入的矩陣進行融合,得到節點向量表示;一分類結果輸出???,用分類函數得到節點最終的多標簽分類結果。在本專利技術一實施例中,所述數據預處理???,采用二維平面上的歐幾里得網格的規則來表示結構,節點之間的邊用概率決定。在本專利技術一實施例中,所述節點嵌入???,利用節點間的距離相似、節點間屬性的余弦相似度的分歧程度來表示兩個節點的相似度,進而通過將每兩個節點的相似度作為相似矩陣上的元素,構造網絡的相似矩陣,得到節點嵌入表示。在本專利技術一實施例中,所述標簽嵌入???,將標簽中的節點的鄰接領域信息映射到向量表示中,利用節點屬性網絡的表示學習接近度來平滑標簽信息建模;而后,將具有相同的標簽的節點包含在同一個集合中,并計算的余弦相似度矩陣,并通過計算拉普拉斯矩陣,其中,計算為余弦相似度矩陣,是的度矩陣;最后,使用已學習到的網絡嵌入的矩陣來做過渡,得到最終的標簽嵌入表示。在本專利技術一實施例中,述分類結果輸出???,根據節點向量表示,利用softmax分類函數對所得向量逐一計算,根據設定的閾值得到節點關于標簽類別的預測值;在訓練階段,需要將預測值與目標值求誤差,并利用隨機梯度下降法和后向傳播對整個系統的參數進行迭代更新;否則,只需將得到的預測值輸出即可。在本專利技術一實施例中,還包括一信息采集???,用于將網絡中的用戶信息進行采集和標簽標記,而后輸入給所述數據預處理???。本專利技術還提供了一種融合標簽信息的多標簽分類方法,包括如下步驟:首先,將網絡中的用戶信息進行采集和標簽標記,并對網絡中結構進行節點和邊的表示;其次,利用譜技術的方法將節點和節點屬性進行結合,構造網絡的相似矩陣;再而,利用譜技術方法將網絡空間中的標簽信息進行表示學習,與已學習到的網絡嵌入的矩陣進行融合,得到節點向量表示;最后,根據節點向量表示,用分類函數得到節點最終的多標簽分類結果。在本專利技術一實施例中,所述對網絡中結構進行節點和邊的表示,即:采用二維平面上的歐幾里得網格的規則來表示結構,節點之間的邊用概率決定。在本專利技術一實施例中,所述構造網絡的相似矩陣,即:利用節點間的距離相似、節點間屬性的余弦相似度的分歧程度來表示兩個節點的相似度,進而通過將每兩個節點的相似度作為相似矩陣上的元素,構造網絡的相似矩陣,得到節點嵌入表示。在本專利技術一實施例中,所述利用譜技術方法將網絡空間中的標簽信息進行表示學習,與已學習到的網絡嵌入的矩陣進行融合,得到節點向量表示,即:將標簽中的節點的鄰接領域信息映射到向量表示中,利用節點屬性網絡的表示學習接近度來平滑標簽信息建模;而后,將具有相同的標簽的節點包含在同一個集合中,并計算的余弦相似度矩陣,并通過計算拉普拉斯矩陣,其中,計算為余弦相似度矩陣,是的度矩陣;最后,使用已學習到的網絡嵌入的矩陣來做過渡,得到最終的標簽嵌入表示。相較于現有技術,本專利技術具有以下有益效果:本專利技術能夠將節點向量特征得分融入到現有的排序學習框架中進行分類,并按照順序輸出節點。附圖說明圖1為本專利技術方法流程圖。具體實施方式下面結合附圖,對本專利技術的技術方案進行具體說明。本專利技術提供了一種融合標簽信息的多標簽分類原型系統,包括:一數據預處理???,用于對網絡中結構進行節點和邊的表示;一節點嵌入???,利用譜技術的方法將節點和節點屬性進行結合,構造網絡的相似矩陣;一標簽嵌入???,利用譜技術方法將網絡空間中的標簽信息進行表示學習,與已學習到的網絡嵌入的矩陣進行融合,得到節點向量表示;一分類結果輸出???,用分類函數得到節點最終的多標簽分類結果。在本專利技術一實施例中,還包括一信息采集???,用于將網絡中的用戶信息進行采集和標簽標記,而后輸入給所述數據預處理???。本專利技術還提供了一種融合標簽信息的多標簽分類方法,包括如下步驟:首先,將網絡中的用戶信息進行采集和標簽標記,并對網絡中結構進行節點和邊的表示;其次,利用譜技術的方法將節點和節點屬性進行結合,構造網絡的相似矩陣;再而,利用譜技術方法將網絡空間中的標簽信息進行表示學習,與已學習到的網絡嵌入的矩陣進行融合,得到節點向量表示;最后,根據節點向量表示,用分類函數得到節點最終的多標簽分類結果。以下為本專利技術的具體實現過程。如圖1所示,根據本專利技術實施例在網絡節點中的多標簽分類分析系統包括:數據預處理???,對節點進行特征化處理;節點嵌入???,用于將節點和節點屬性進行結合,構造網絡的相似矩陣;標簽嵌入???,用譜技術方法將標簽信息進行表示學習,與已學習到的網絡嵌入的矩陣進行融合,得到節點向量表示;分類結果輸出???,用分類函數得到節點最終的多標簽分類結果。下面分別詳細描述各??櫚吶渲?。1)數據預處理???首先,描述數據預處理??槿綰斡沒Ы惺蕕腦ご?。用二維平面上的歐幾里得網格的規則來表示結構,節點之間的邊用一個概率決定,也就是隨機網絡。2)節點嵌入???下面描述節點嵌入???是如何將上一??櫚玫降氖萁薪詰闈度氳?。該??櫚墓菇ǖ暮誦乃枷朧槍刈⒚慷越詰愫?,如果它們具有相似的局部屬性,那么它們的向量表本文檔來自技高網...

【技術?;さ恪?/strong>
1.一種融合標簽信息的多標簽分類原型系統,其特征在于,包括:一數據預處理???,用于對網絡中結構進行節點和邊的表示;一節點嵌入???,利用譜技術的方法將節點和節點屬性進行結合,構造網絡的相似矩陣;一標簽嵌入???,利用譜技術方法將網絡空間中的標簽信息進行表示學習,與已學習到的網絡嵌入的矩陣進行融合,得到節點向量表示;一分類結果輸出???,用分類函數得到節點最終的多標簽分類結果。

【技術特征摘要】
1.一種融合標簽信息的多標簽分類原型系統,其特征在于,包括:一數據預處理???,用于對網絡中結構進行節點和邊的表示;一節點嵌入???,利用譜技術的方法將節點和節點屬性進行結合,構造網絡的相似矩陣;一標簽嵌入???,利用譜技術方法將網絡空間中的標簽信息進行表示學習,與已學習到的網絡嵌入的矩陣進行融合,得到節點向量表示;一分類結果輸出???,用分類函數得到節點最終的多標簽分類結果。2.根據權利要求1所述的系統,其特征在于,所述數據預處理???,采用二維平面上的歐幾里得網格的規則來表示結構,節點之間的邊用概率決定。3.根據權利要求1所述的系統,其特征在于,所述節點嵌入???,利用節點間的距離相似、節點間屬性的余弦相似度的分歧程度來表示兩個節點的相似度,進而通過將每兩個節點的相似度作為相似矩陣上的元素,構造網絡的相似矩陣,得到節點嵌入表示。4.根據權利要求1所述的系統,其特征在于,所述標簽嵌入???,將標簽中的節點的鄰接領域信息映射到向量表示中,利用節點屬性網絡的表示學習接近度來平滑標簽信息建模;而后,將具有相同的標簽的節點包含在同一個集合中,并計算的余弦相似度矩陣,并通過計算拉普拉斯矩陣,其中,計算為余弦相似度矩陣,是的度矩陣;最后,使用已學習到的網絡嵌入的矩陣來做過渡,得到最終的標簽嵌入表示。5.根據權利要求1所述的系統,其特征在于,所述分類結果輸出???,根據節點向量表示,利用softmax分類函數對所得向量逐一計算,根據設定的閾值得到節點關于標簽類別的預測值;在訓練階段,需要將預測值與目標值求誤差,并利用隨機梯度下降法和后向傳播對整個系統的參數進行迭代更新;否則,只需將得到的...

【專利技術屬性】
技術研發人員:廖祥文,聶煜,陳志豪,陳國龍,
申請(專利權)人:福州大學,
類型:發明
國別省市:福建,35

網友詢問留言 已有0條評論
  • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

1
老重庆时时开彩结果 赛车6码二期怎么玩 彩神幸运飞艇平刷冠军 筒子二八杠技巧口诀 重庆时时开奖号码记录 pk10最牛稳赚6计划软件 筛子比大小 网络扎金花技巧有哪些 spbo体球网足球比分 极速时时定胆公式 破解游戏黑客联系方式 管家婆原创36码 重庆欢乐生肖是不是官方的 云南时时基本走势图 稳赚包平特1肖二期最少开1 足球直播