大数跨境
0
0

如何用Python识别「字符」属于哪个国家?

如何用Python识别「字符」属于哪个国家? 数据分析与统计学之美
2022-01-26
0

大家好,我是黄同学🚀

前几天,在粉丝群碰到这样一个需求。
哈哈,黄同学只想说,真是什么需求都有人问,而Python真的是什么都能做。
你现在不知道,可能是还没有碰到过。但是多学习一下也没有错,万一哪一天用上了呢?
今天黄同学就带你来解决这个问题。
这里使用的是langid库,但是必须提前安装。
  
pip install langid
langid库中,有一个classify()方法,它可以帮助我们识别不同国家的文本,最终返回一个元组,第一个参数,是该语言最可能的国家;第二个参数,是置信度,表示有多大把握。
我们直接上案例,为大家做一个演示。下面有5个字符串,分别是不同国家关于"你好"的发音。
  
import langid

str1 = '你好'
str2 = 'hello'
str3 = '안녕하세요'
str4 = 'こんにちは'
str5 = 'Добрый день'

langid.classify(str1)
langid.classify(str2)
langid.classify(str3)
langid.classify(str4)
langid.classify(str5)
结果如下:
有了这个库,在做某个项目时,我们就可以筛选掉其它不需要的语种,是不是巴适得板。
推荐阅读    点击标题可跳转
0. 深度对比Python4大文件/文件夹处理库!
1. Python快速实现分列转到行!
2. 对比学习12款Python数据可视化库!
3. 如何用Python分析股票收益率?
4. pprint漂亮的打印,强烈推荐大家学习这个库!
5. 数据分析方法论,大总结!
6. 有了这款Python神器,新手也会调试代码!
7. Pandas与openpyxl库的 "完美" 融合!
8. Python提取PDF简历中的信息,写入Excel
9. Linux系列:完美收官,一共22个课时!
10. Python操作MySQL数据库!
11. 一个「神奇」的Python库,99%的人都爱!
12. 对比Excel/MySQL/Python,讲述if的使用原理!
13. 坐地铁,就能学会的3种"非常有趣"的Python玩法!-1
14. 坐地铁,就能学会的3种"非常有趣"的Python玩法!-2
15. 坐地铁,就能学会的3种"非常有趣"的Python玩法!-3
【声明】内容源于网络
0
0
数据分析与统计学之美
免费领10w字"Python知识手册",共400页,后台回复“十万”领取!
内容 1080
粉丝 0
数据分析与统计学之美 免费领10w字"Python知识手册",共400页,后台回复“十万”领取!
总阅读210
粉丝0
内容1.1k