如果dataframe中的行以关键字开头,请将其与上面的行连接起来

If row in dataframe starts with keyword, concat it with the row above(如果dataframe中的行以关键字开头,请将其与上面的行连接起来)

本文介绍了如果dataframe中的行以关键字开头,请将其与上面的行连接起来的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我有一个类似于here的问题,但我一直无法解答。

我有一个结构如下的DataFrame:

0 inner join xx
1 on xx
2 and xx
3 and yy
4 and aa
5 inner join zz

我尝试将以‘and’开头的行追加到前一行,结果如下所示:

0 inner join xx
1 on xx and xx and yy and aa
2 inner join zz

稍后,我将对"on"关键字执行相同的操作。

这是我到目前为止拥有的代码。它可以工作,但只能追加一次。留给我额外的‘and’关键字:

for row in df:
     s = df['join'].shift(-1)
     m = s.str.startswith('and', na=False)
     df.loc[m, 'join'] += (' ' + s[m])

推荐答案

可以使用groupby+apply

(df.groupby((~df['join'].str.startswith('and ')).cumsum())
   ['join'].apply(' '.join)
)

输出:

join
1                 inner join xx
2    on xx and xx and yy and aa
3                 inner join zz
Name: join, dtype: object

这篇关于如果dataframe中的行以关键字开头,请将其与上面的行连接起来的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!

本文标题为:如果dataframe中的行以关键字开头,请将其与上面的行连接起来

基础教程推荐