表达式

# 选择foo列,给foo排序,然后取排序后的前两个值
pl.col("foo").sort().head(2)

基础操作

# 数据访问
# pandas写法df['column'].iloc[0] 
df.select('column').item(0, 0)

# 生成列表
# pandas写法df['column'].tolist()
df.select('column').to_series().to_list()

过滤特征

# 过滤正常交易状态
df = df.filter(pl.col('交易状态') == '正常交易')

# 过滤时间范围
df.filter((pl.col('Time') >= 92600000) & (pl.col('Time') <= 93100000))

类型转换

df.with_columns(df["column_name"].cast(new_dtype))

# 整数转浮点数
df = df.with_columns(df["int_column"].cast(pl.Float64))