Strip the byte order mark from string in C#(在C#中从字符串中剥离字节顺序标记)
问题描述
在C#中,我有一个从WebClient.DownloadString获得的字符串。我尝试将client.Encoding设置为新的UTF8Encoding(False),但没有什么不同-我在结果字符串的开头仍然得到了UTF-8的字节顺序标记。我需要删除它(以便使用LINQ解析生成的XML),并且希望在内存中执行此操作。
所以我有一个以x00EFx00BBx00BF开头的字符串,如果它存在的话,我想删除它。现在我正在使用
if (xml.StartsWith(ByteOrderMarkUtf8))
{
xml = xml.Remove(0, ByteOrderMarkUtf8.Length);
}
但那感觉就是不对劲。我用STREAMS、GetBytes和编码尝试了各种代码,但都不起作用。是否有人能够提供从字符串中剥离BOM的&Quot;Right&Quot;算法?
BOM
如果变量推荐答案的类型为String,则您已经做错了什么-在字符串中,BOM不应该表示为三个单独的字符,而应该表示为一个代码点。不使用DownloadString,而使用DownloadData,并解析字节数组。XML解析器应该识别BOM本身,并跳过它(自动检测文档编码为UTF-8除外)。
这篇关于在C#中从字符串中剥离字节顺序标记的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
本文标题为:在C#中从字符串中剥离字节顺序标记
基础教程推荐
- MS Visual Studio .NET 的替代品 2022-01-01
- 如何激活MC67中的红灯 2022-01-01
- 为什么Flurl.Http DownloadFileAsync/Http客户端GetAsync需要 2022-09-30
- rabbitmq 的 REST API 2022-01-01
- SSE 浮点算术是否可重现? 2022-01-01
- c# Math.Sqrt 实现 2022-01-01
- 将 Office 安装到 Windows 容器 (servercore:ltsc2019) 失败,错误代码为 17002 2022-01-01
- 有没有办法忽略 2GB 文件上传的 maxRequestLength 限制? 2022-01-01
- 将 XML 转换为通用列表 2022-01-01
- 如何在 IDE 中获取 Xamarin Studio C# 输出? 2022-01-01