polars
表达式
# 选择foo列,给foo排序,然后取排序后的前两个值
pl.col("foo").sort().head(2)
基础操作
# 数据访问
# pandas写法df['column'].iloc[0]
df.select('column').item(0, 0)
# 生成列表
# pandas写法df['column'].tolist()
df.select('column').to_series().to_list()
过滤特征
# 过滤正常交易状态
source_df = source_df.filter(pl.col('TRADESTATUS') == '正常交易')
类型转换
df.with_columns(df["column_name"].cast(new_dtype))
# 整数转浮点数
df = df.with_columns(df["int_column"].cast(pl.Float64))