熱線電話:13121318867

登錄
首頁精彩閱讀python用戶評論標簽匹配的解決方法
python用戶評論標簽匹配的解決方法
2018-06-22
收藏

python用戶評論標簽匹配的解決方法

這篇文章主要為大家詳細介紹了python用戶評論標簽匹配的解決方法,具有一定的參考價值,感興趣的小伙伴們可以參考一下

我們觀察用戶評論發現:屬性詞往往和情感詞伴隨出現,原因是用戶通常會在描述屬性時表達情感,屬性是情感表達的對象。還發現:屬性詞和專用情感詞基本都是名詞或形容詞(形謂詞)。

算法流程圖如下:

評論數據如下:

代碼如下:

代碼如下:    
#encoding=utf-8
 
#############################
#
# 功能:給定一些中文的產品評論,希望從中找到評價對象及評價詞。
#
# @author:licl
#
##############################
 
fdata = open('JD_DFB_comments_out.txt','r')
Output = open('Pattern_Result.txt','a')
 
try:
 data = fdata.readlines()
   
 listline = []
   
   
 for line in data:
    
  listline = line.replace(" ","/")
  listline = listline.split("/")
    
  i = 1
    
  while i < len(listline):
     
   if listline[i] != "名詞":
      
    i = i+2
      
   else:
      
    new_list = ["","",""]
    new_list[0] = listline[i-1]
      
    a = i-1
    i = i+2
      
    while i < len(listline):     
       
     if listline[i] == "標點":
        
      i = i+2
      break
       
     else:
        
      if listline[i-1]=='不' or listline[i-1]=='不怎么樣' or listline[i-1]=='不怎么' or listline[i-1]=='不太':  
       new_list[1] = listline[i-1]
      if listline[i] == "形容詞" or listline[i] == "形謂詞":
       new_list[1] += listline[i-1]
         
       b = i-1    
       t = (b-a)/2  
       new_list[2] = str(t)
       for line in new_list:
          
        Output.write(line + " ")
          
       Output.write("\n")  
       break
        
      else:
       
       i = i+2
except:
 print "‘文件不存在'或者‘文件無法打開'"
    
finally:
   
 fdata.close()
 Output.close()
以上就是本文的全部內容,希望對大家的學習有所幫助

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢