Regular expressions for a range of unicode points PHP(一系列 unicode 点 PHP 的正则表达式)
本文介绍了一系列 unicode 点 PHP 的正则表达式的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我试图从字符串中去除所有字符,除了:
I'm trying to strip all characters from a string except:
- 字母数字字符
- 美元符号 (
$
) - 下划线 (
_
) - 代码点
U+0080
和U+FFFF
之间的Unicode字符
- Alphanumeric characters
- Dollar sign (
$
) - Underscore (
_
) - Unicode characters between code points
U+0080
andU+FFFF
我通过这样做获得了前三个条件:
I've got the first three conditions by doing this:
preg_replace('/[^a-zA-Zd$_]+/', '', $foo);
如何匹配第四个条件?我查看了使用 X
但有必须比列出 65000 多个字符更好.
How do I go about matching the fourth condition? I looked at using X
but there has to be a better way than listing out 65000+ characters.
推荐答案
您可以使用:
$foo = preg_replace('/[^w$x{0080}-x{FFFF}]+/u', '', $foo);
w
- 相当于[a-zA-Z0-9_]
x{0080}-x{FFFF}
匹配代码点U
+0080和
U+FFFF`<之间的字符/li>/u
用于正则表达式中的 unicode 支持w
- is equivalent of[a-zA-Z0-9_]
x{0080}-x{FFFF}
to match characters between code pointsU
+0080and
U+FFFF`/u
for unicode support in regex
这篇关于一系列 unicode 点 PHP 的正则表达式的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
沃梦达教程
本文标题为:一系列 unicode 点 PHP 的正则表达式
基础教程推荐
猜你喜欢
- 使用 PDO 转义列名 2021-01-01
- 在 yii2 中迁移时出现异常“找不到驱动程序" 2022-01-01
- 如何在 XAMPP 上启用 mysqli? 2021-01-01
- HTTP 与 FTP 上传 2021-01-01
- PHP 守护进程/worker 环境 2022-01-01
- 在 CakePHP 2.0 中使用 Html Helper 时未定义的变量 2021-01-01
- phpmyadmin 错误“#1062 - 密钥 1 的重复条目‘1’" 2022-01-01
- 找不到类“AppHttpControllersDB",我也无法使用新模型 2022-01-01
- Doctrine 2 - 在多对多关系中记录更改 2022-01-01
- 如何在 Symfony 和 Doctrine 中实现多对多和一对多? 2022-01-01