C++ libcurl - Can#39;t retrieve whole html content from URL(C++libcurl-无法从URL检索整个html内容)
本文介绍了C++libcurl-无法从URL检索整个html内容的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
使用C++和libcurl库,我试图以这种方式从该网站https://www.nutritionix.com/food/Banana获取完整的HTML:
int main(){
std::string content;
curl_global_init(CURL_GLOBAL_ALL);
CURL *curl = nullptr;
curl = curl_easy_init();
if (curl) {
curl_easy_setopt(curl, CURLOPT_URL, "https://www.nutritionix.com/food/Banana" );
curl_easy_setopt(curl, CURLOPT_FOLLOWLOCATION, 1L);
curl_easy_setopt(curl, CURLOPT_WRITEDATA, &content);
curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, writer);
CURLcode code = curl_easy_perform(curl);
curl_easy_cleanup(curl);
}
curl_global_cleanup();
std::cout << content << std::endl;
system("pause");
}
writer
函数定义如下:
static int writer(char *data, size_t size, size_t nmemb, std::string *writerData) {
if (writerData == NULL)
return 0;
writerData->append(data, size*nmemb);
return size * nmemb;
}
通过这种方式,我可以只获得几个HTML代码,但如何检索完整的HTML内容以在稍后阶段对其进行分析?
推荐答案
在现代网站上,一个简单的http请求只会返回一些带有一些脚本和元数据的70字符长的响应。脚本在加载时执行,然后将填充页面内容。您不能这样说,或者更好地说:您拥有网站调用的全部html内容。
亲自尝试
- 访问https://www.nutritionix.com/food/Banana
- Ctrl+Shift+I
- 转到网络选项卡并重新加载页面
- 单击列表中名为"Banana"的第一项
- 单击右侧的"响应"
这是执行上述代码后字符串包含的内容
这篇关于C++libcurl-无法从URL检索整个html内容的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
沃梦达教程
本文标题为:C++libcurl-无法从URL检索整个html内容
基础教程推荐
猜你喜欢
- 您如何将 CreateThread 用于属于类成员的函数? 2021-01-01
- 如何定义双括号/双迭代器运算符,类似于向量的向量? 2022-01-01
- 设计字符串本地化的最佳方法 2022-01-01
- 如何在 C++ 中处理或避免堆栈溢出 2022-01-01
- 调用std::Package_TASK::Get_Future()时可能出现争用情况 2022-12-17
- C++,'if' 表达式中的变量声明 2021-01-01
- 运算符重载的基本规则和习语是什么? 2022-10-31
- C++ 标准:取消引用 NULL 指针以获取引用? 2021-01-01
- C++ 程序在执行 std::string 分配时总是崩溃 2022-01-01
- 什么是T&&(双与号)在 C++11 中是什么意思? 2022-11-04