regex to print url from any webpage with specific word in url(正则表达式用于打印URL中包含特定单词的任何网页中的URL)
                            本文介绍了正则表达式用于打印URL中包含特定单词的任何网页中的URL的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
                        
                        问题描述
我正在使用下面的代码从网页中提取url,它工作得很好,但我想要过滤它。它将显示页面中所有URL,但我只想要由单词"Super"组成的URL
     $regex='|<a.*?href="(.*?)"|';
preg_match_all($regex,$result,$parts);
$links=$parts[1];
foreach($links as $link){
echo $link."<br>";
       }
所以它应该只在单词SUPER出现的地方回显uls。 例如,它应该忽略url
       http://xyz.com/abc.html  
但它应该回显
        http://abc.superpower.com/hddll.html
因为它由url中必需的单词Super组成
推荐答案
使您的正则表达式不贪婪,它应该可以工作:
$regex = '|<a.*?href="(.*?super[^"]*)"|is';
但是,若要分析和废弃HTML,最好使用php的DOM分析器。
更新:以下是使用DOM解析器的代码:
$request_url ='1900girls.blogspot.in/';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $request_url);    
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); 
$result = curl_exec($ch);
$doc = new DOMDocument();
libxml_use_internal_errors(true);
$doc->loadHTML($result); // loads your html
$xpath = new DOMXPath($doc);
$needle = 'blog';
$nodelist = $xpath->query("//a[contains(@href, '" . $needle . "')]");
for($i=0; $i < $nodelist->length; $i++) {
    $node = $nodelist->item($i);
    echo $node->getAttribute('href') . "
";
}
                        这篇关于正则表达式用于打印URL中包含特定单词的任何网页中的URL的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
				 沃梦达教程
				
			本文标题为:正则表达式用于打印URL中包含特定单词的任何网页中的URL
				
        
 
            
        基础教程推荐
             猜你喜欢
        
	     - php 7.4 在写入变量中的 Twig 问题 2022-01-01
 - 主题化 Drupal 7 的 Ubercart “/cart"页 2021-01-01
 - 如何在数学上评估像“2-1"这样的字符串?产生“1"? 2022-01-01
 - Yii2 - 在运行时设置邮件传输参数 2022-01-01
 - 使用 scandir() 在目录中查找文件夹 (PHP) 2022-01-01
 - PHPUnit 的 Selenium 2 文档到底在哪里? 2022-01-01
 - php中的foreach复选框POST 2021-01-01
 - php中的PDF导出 2022-01-01
 - Web 服务器如何处理请求? 2021-01-01
 - 将变量从树枝传递给 js 2022-01-01
 
    	
    	
    	
    	
    	
    	
    	
    	
				
				
				
				