python langid實現語種識別


2017-04-26

語料數據入庫時有個小需求,需要用一個字段存儲語料的語種,偶然發現langid可以實現這一功能,再次感嘆python的好用!

#coding=utf-8
import langid                             #引入langid模塊 

s1 = '你好'
s2 = 'hello'
s3 = 'Flüssigkeiten zum Nassbehandeln von Wäschestücken werden vielfach mit Dampf aufgeheizt. Dazu wird der Dampf mit hoher Geschwindigkeit durch eine Düse (30) der aufzuheizenden Flüssigkeit direkt zugeführt. Aufgrund der hohen Geschwindigkeit, mit der der Dampf in die aufgeheizte Flüssigkeit einströmt, entstehen starke Geräusche sowie Schwingungen und Vibrationen. Um mindestens die Geräusche zu reduzieren, ist es bereits bekannt, zusätzlich Druckluft zuzuführen. Das verschlechtert den Wärmeübergang. Die Erfindung sieht es vor, in die Düse (30) eine kleine Menge der aufzuheizenden Flüssigkeit einzusaugen und dadurch in der Düse (30) ein Kondensat-Dampfgemisch zu bilden. Alternativ oder zusätzlich kann hinter der Düse (30) ein Strömungsteiler vorgesehen sein, der die Strömungsgeschwindigkeit des Dampfs bzw. Dampf-Kondensatgemisches erhöht. Hierdurch und/oder durch die Bildung eines Dampf-Kondensatgemisches in der Düse (30) werden die Geräuschentwicklung beim Einleiten des Dampfs in die aufzuheizende Flüssigkeit sowie Schwingungen und Vibrationen ohne die Zufuhr von Druckluft verringert'

i = langid.classify(s1)
j = langid.classify(s2)
m = langid.classify(s3)

print m, m[0], type(m)

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM