Subpattern Regex match within nested quotes(嵌套引号内的子模式正则表达式匹配)
本文介绍了嵌套引号内的子模式正则表达式匹配的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我正在从一些带有许多不必要的嵌套[QUOTE]标记的旧论坛软件升级,我想通过regex(使用PHP preg_place)去掉这些标记。其中大多数已经完成,但我正在努力处理以下类型。
帖子中有嵌套的引号块,但只需要保留顶层[报价]内容(因为某些嵌套引号有3或4层深)。
例如:
Here is some normal post content
[QUOTE]
This is an appropriate quote
[/QUOTE]
Here is more post content
[QUOTE]
This is a a valid quote, as it's only 1 level deep.
[QUOTE="User 2"]
Here's an unnecessary nested quote.
[QUOTE]
Here's a 3nd level unnecessary nested quote.
[/QUOTE]
[/QUOTE]
[/QUOTE]
Here is more post content
我想删除第二级和第三级嵌套引号,但无法确定如何操作。
我对strip nested quotes完全有一些很好的建议,但我一直无法修改正则表达式模式以适应此示例。
推荐答案
是的,您可以使用链接答案中的相同正则表达式,并将其与一些编程逻辑结合使用两次:
<?php
$regex = '~
([QUOTE[^][]*]
(?:[^][]++|(?1))++
[/QUOTE])
~x';
$data = preg_replace_callback($regex,
function($match) use($regex) {
return $match[0][0] . preg_replace($regex, '', substr($match[0], 1));
},
$your_data_string_here);
echo $data;
?>
下面是您的示例:
Here is some normal post content
[QUOTE]
This is an appropriate quote
[/QUOTE]
Here is more post content
[QUOTE]
This is a a valid quote, as it's only 1 level deep.
[/QUOTE]
Here is more post content
这里的想法是匹配每个引号标记(嵌套或不嵌套),然后将相同的表达式应用于匹配的字符串,但偏移量为+1。当我们获取一个子字符串时,只找到下一个嵌套的
[QUOTE]
集合,然后将其替换。
Ademo on regex101.com和on ideone.com进一步阐明了这一点。
这篇关于嵌套引号内的子模式正则表达式匹配的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
沃梦达教程
本文标题为:嵌套引号内的子模式正则表达式匹配
基础教程推荐
猜你喜欢
- 在 PHP 中强制下载文件 - 在 Joomla 框架内 2022-01-01
- Libpuzzle 索引数百万张图片? 2022-01-01
- 通过 PHP SoapClient 请求发送原始 XML 2021-01-01
- WooCommerce 中选定产品类别的自定义产品价格后缀 2021-01-01
- XAMPP 服务器不加载 CSS 文件 2022-01-01
- 超薄框架REST服务两次获得输出 2022-01-01
- 在 Woocommerce 中根据运输方式和付款方式添加费用 2021-01-01
- mysqli_insert_id 是否有可能在高流量应用程序中返回 2021-01-01
- 如何在 PHP 中的请求之间持久化对象 2022-01-01
- 在多维数组中查找最大值 2021-01-01