请问如何用scala把emoji表情符号替换但是要保留一些各国语言的文字譬如英文,法文等

现在要把一个结果集中表情符号全部替换为空字符串,但是我发现把一些外国文字也替换了。

scala>     val df = Seq(
     |       (8, "bat★☆😂 😆 ⛱󰀄󰀄 ✨🚣♂⛷🏂❤🤍🪵֎۩ᴥ★ Lôa Créole♥"),
     |       (64, "bb")
     |     ).toDF("number", "word")
df: org.apache.spark.sql.DataFrame = [number: int, word: string]

scala> df.show(false)
+------+------------------------------------------------+
|number|word                                            |
+------+------------------------------------------------+
|8     |bat★☆😂 😆 ⛱󰀄󰀄 ✨🚣‍♂️⛷🏂❤️🤍🪵֎۩ᴥ★ Lôa Créole♥|
|64    |bb                                              |
+------+------------------------------------------------+

我在网上搜了一个这样的

regexp_replace(df("word"), """[^ 'a-zA-Z0-9,.?!]""","")
scala> df.select($"number", $"word", regexp_replace(df("word"), """[^ 'a-zA-Z0-9,.?!]""","").alias("word_revised")).show(false)
+------+------------------------------------------------+---------------+
|number|word                                            |word_revised   |
+------+------------------------------------------------+---------------+
|8     |bat★☆😂 😆 ⛱󰀄󰀄 ✨🚣‍♂️⛷🏂❤️🤍🪵֎۩ᴥ★ Lôa Créole♥|bat    La Crole|
|64    |bb                                              |bb             |
+------+------------------------------------------------+---------------+


scala> 

ô 和 é 这两个是我想要保留的,请问如何改善一下呢?
谢谢

你好,我是有问必答小助手,非常抱歉,本次您提出的有问必答问题,技术专家团超时未为您做出解答


本次提问扣除的有问必答次数,将会以问答VIP体验卡(1次有问必答机会、商城购买实体图书享受95折优惠)的形式为您补发到账户。


因为有问必答VIP体验卡有效期仅有1天,您在需要使用的时候【私信】联系我,我会为您补发。