美丽的汤元内容标签

沃梦达教程前端问题

2022-01-01

Beautiful soup meta content tag(美丽的汤元内容标签)

本文介绍了美丽的汤元内容标签的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

<meta itemprop="streetAddress" content="4103 Beach Bluff Rd">

我必须得到‘4103海滩断崖路’的内容。我正在尝试使用BeautifulSoup完成此操作，因此，我尝试执行以下操作：

soup = BeautifulSoup('<meta itemprop="streetAddress" content="4103 Beach Bluff Rd"> ')

soup.find(itemprop="streetAddress").get_text()

但我得到的结果是一个空字符串，这在打印Soup对象时可能有意义

print soup

我得到的是This：

<html><head><meta content="4103 Beach Bluff Rd" itemprop="streetAddress"/> </head></html>

显然我需要的数据在‘meta content’标记中，我如何获取此数据？

推荐答案

soup.find(itemprop="streetAddress").get_text()

您将获得匹配元素的文本。相反，获取"Content"属性值：

soup.find(itemprop="streetAddress").get("content")

这是可能的，因为BeautifulSoup提供了dictionary-like interface to tag attributes：

您可以通过将标记视为词典来访问该标记的属性。

演示：

>>> from bs4 import BeautifulSoup
>>>
>>> soup = BeautifulSoup('<meta itemprop="streetAddress" content="4103 Beach Bluff Rd"> ')
>>> soup.find(itemprop="streetAddress").get_text()
u''
>>> soup.find(itemprop="streetAddress").get("content")
'4103 Beach Bluff Rd'

这篇关于美丽的汤元内容标签的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持编程学习网！

沃梦达教程

本文标题为：美丽的汤元内容标签