我有一个USQL脚本和CSV提取器来加载我的文件.但是有些月份文件可能包含4列,有些月份可能包含5列.如果我使用4或5个字段的列列表设置我的提取器,我会收到有关文件预期宽度的错误.去检查分隔符等等.毫不奇怪.这个问题...
我有一个USQL脚本和CSV提取器来加载我的文件.但是有些月份文件可能包含4列,有些月份可能包含5列.
如果我使用4或5个字段的列列表设置我的提取器,我会收到有关文件预期宽度的错误.去检查分隔符等等.毫不奇怪.
这个问题的解决方法是什么,因为USQL仍然是一个新手并且缺少一些基本的错误处理?
我已经尝试在提取器中使用silent子句忽略更宽的列,这对4列很方便.然后获取具有IF条件的行集的行计数,然后该条件具有5列的提取器.然而,这导致行集变量的世界不被用作IF表达式中的标量变量.
我还尝试了C#样式计数和sizeof(@ AttemptExtractWith4Cols).都没有工作.
代码片段让您了解我正在采取的方法:
DECLARE @SomeFilePath string = @"/MonthlyFile.csv";
@AttemptExtractWith4Cols =
EXTRACT Col1 string,
Col2 string,
Col3 string,
Col4 string
FROM @SomeFilePath
USING Extractors.Csv(silent : true); //can't be good.
//can't assign rowset to scalar variable!
DECLARE @RowSetCount int = (SELECT COUNT(*) FROM @AttemptExtractWith4Cols);
//tells me @AttemptExtractWith4Cols doesn't exist in the current context!
DECLARE @RowSetCount int = @AttemptExtractWith4Cols.Count();
IF (@RowSetCount == 0) THEN
@AttemptExtractWith5Cols =
EXTRACT Col1 string,
Col2 string,
Col3 string,
Col4 string,
Col5 string
FROM @SomeFilePath
USING Extractors.Csv(); //not silent
END;
//etc
当然,如果在USQL中存在TRY CATCH块这样的事情,那将会容易得多.
这甚至是一种合理的方法吗?
任何投入将不胜感激.
感谢您的时间.
解决方法:
U-SQL现在支持OUTER UNION,所以你可以像这样处理它:
// Scenario 1; file has 4 columns
DECLARE @file1 string = @"/input/file1.csv";
// Scenario 2; file has 5 columns
//DECLARE @file1 string = @"/input/file2.csv";
@file =
EXTRACT col1 string,
col2 string,
col3 string,
col4 string
FROM @file1
USING Extractors.Csv(silent : true)
OUTER UNION ALL BY NAME ON (col1, col2, col3, col4)
EXTRACT col1 string,
col2 string,
col3 string,
col4 string,
col5 string
FROM @file1
USING Extractors.Csv(silent : true);
@output =
SELECT *
FROM @file;
OUTPUT @output
TO "/output/output.csv"
USING Outputters.Csv();
在我的示例中,file1有4列,file2有5列.该脚本在任一方案中都成功运行.
我的结果:
希望有道理.
本文标题为:c# – 在USQL中处理具有不同列的文件
基础教程推荐
- C#使用SqlConnection连接到SQL Server的代码示例 2023-01-16
- C#深度优先遍历实现全排列 2023-02-03
- WPF实现动画效果(一)之基本概念 2023-06-20
- C#中GDI+绘制圆弧及圆角矩形等比缩放的绘制 2023-07-04
- c#实现选择排序的示例 2023-03-14
- C#中如何正确的使用字符串String 2023-01-06
- c# – 如何克服Windows运行时类型的Windows组件限制? 2023-09-20
- 分析C# Dictionary的实现原理 2023-04-22
- WPF实现手风琴式轮播图切换效果 2023-03-10
- Unity使用物理引擎实现多旋翼无人机的模拟飞行 2023-04-14