Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

Wproj

wproj 是 Warp Parse 项目管理工具,提供完整的项目生命周期管理功能,包括项目初始化和配置管理、数据源的检查和统计、模型管理和知识库创建维护。

命令概览

wproj <COMMAND>

Commands:
  rule   规则工具:解析规则的管理和调试 | Rule tools: management and debugging of parsing rules
  init   一键初始化完整工程骨架 | Initialize complete project skeleton
  check  批量检查项目配置和文件完整性 | Batch check project configuration and file integrity
  data   数据管理工具:清理、统计、验证 | Data management tools: cleanup, statistics, validation
  model  模型管理工具:规则、源、汇、知识库 | Model management tools: rules, sources, sinks, knowledge base

init - 项目初始化

一键创建项目目录结构和默认配置。

wproj init [OPTIONS]
参数短选项长选项默认值说明
mode-m--modeconf初始化模式

初始化模式:

模式说明
full完整项目(配置+模型+数据+示例+链接器)
normal完整项目(配置+模型+数据+示例)
model仅模型文件
conf仅配置文件
data仅数据目录

示例:

# 初始化配置(默认)
wproj init -w /project

# 初始化完整项目
wproj init -w /project --mode full

check - 项目检查

批量检查项目配置和文件完整性。

wproj check [OPTIONS]
参数短选项长选项默认值说明
work_root-w--work-root.根目录
what---whatall检查项
console---consolefalse控制台日志输出
fail_fast---fail-fastfalse首次失败即退出
json---jsonfalseJSON 格式输出
only_fail---only-failfalse仅输出失败项

检查项(–what):

说明
conf主配置文件
connectors连接器配置
sources数据源配置
sinks数据汇配置
wplWPL 规则语法
omlOML 模型语法
all全部检查(默认)

示例:

# 全面检查
wproj check -w /project --what all

# 仅检查配置和规则,首次失败即退出
wproj check -w /project --what conf,wpl --fail-fast

# JSON 输出,仅显示失败项
wproj check -w /project --json --only-fail

data - 数据管理

wproj data <SUBCOMMAND>

Subcommands:
  clean     清理本地输出文件
  check     检查数据源连通性
  stat      统计数据量和性能
  validate  验证数据分布和比例

data clean

清理项目输出数据。

wproj data clean

data stat

统计数据量。

wproj data stat 

data validate

验证数据分布和比例。

wproj data validate [OPTIONS]
参数短选项长选项默认值说明
input_cnt---input-cnt-输入总数(分母)

示例:

# 清理输出数据
wproj data clean 

# 统计源+SINK文件行数
wproj data stat 

# 验证数据分布
wproj data validate 

model - 模型管理

TODO!


rule - 规则工具

离线解析测试,验证 WPL 规则。

wproj rule parse [OPTIONS]

示例:

# 使用规则执行离线解析测试
wproj rule parse