这个问题在这里被问到 Python:如何删除所有表情符号 没有解决方案,我已经朝着解决方案迈出了一步。但需要帮助完成它。
我去表情符号网站获取了所有表情符号十六进制代码点: https ://www.unicode.org/emoji/charts/emoji-ordering.txt
然后我像这样读入文件:
file = open('emoji-ordering.txt')
temp = file.readline()
final_list = []
while temp != '':
#print(temp)
if not temp[0] == '#' :
utf_8_values = ((temp.split(';')[0]).rstrip()).split(' ')
values = ["u\\"+(word[0]+((8 - len(word[2:]))*'0' + word[2:]).rstrip()) for word in utf_8_values]
#print(values[0])
final_list = final_list + values
temp = file.readline()
print(final_list)
我希望这会给我 unicode 文字。它没有,我的目标是获得 unicode 文字,这样我就可以使用上一个问题的部分解决方案并能够排除所有表情符号。任何想法我们需要什么来获得解决方案?
原文由 FeFiFoFum 发布,翻译遵循 CC BY-SA 4.0 许可协议
首先安装表情符号:
或者
所以这样做:
这对我有用!
或者你可以试试:
更新:
版本 emoji==1.7.0 是最后一个具有 UNICODE_EMOJI 的版本。
您也可以尝试使用 EMOJI_DATA 来替代 UNICODE_EMOJI。如果您解释如何使用 UNICODE_EMOJI 或显示您的代码,我可以提供更具体的帮助。
或者您可以尝试上述两种解决方案之一: