从聚水潭到MySQL：销售出库数据的ETL实战

2022-10-26 10:59:20
轻易云集成顾问-孙传友

聚水潭-销售出库单-->BI狄菲俪诗-销售出库表数据集成方案

在现代企业的业务过程中，数据流转效率和准确性是至关重要的一环。本文将分享如何通过轻易云平台，将聚水潭·奇门系统中的销售出库单数据高效集成到MySQL数据库中的BI狄菲俪诗-销售出库表。

数据抓取与接口调用

首先，我们需要从聚水潭·奇门系统中获取销售信息。使用API jushuitan.saleout.list.query，能够定时、可靠地抓取所需的数据。这一步骤需要特别注意分页和限流问题，以确保不会遗漏任何关键的销售信息。同时，为了应对可能出现的数据传输异常，我们实现了详细的错误重试机制来保障数据抓取过程的稳定性。

数据转换与映射处理

在完成初步的数据获取后，需要针对具体业务需求进行自定义的数据转换和映射。在本案例中，不同于聚水潭·奇门原有的数据结构形式，MySQL数据库用于存储的信息格式往往有所不同。因此，通过平台提供的灵活自定义转换逻辑，我们可以有效地将原始数据适配到目标表结构中，提高日后查询及分析的方便性。

高吞吐量写入 MySQL

随着大批量销售信息顺利地从聚水潭·奇门系统提取并加工完毕，大容量、高效率地将其导入到MySQL数据库成为下一步重点解决的问题。此时借助平台强大的高吞吐量写入能力，可以确保即便面对海量交易记录，也能快速且无错漏地完成该任务。此外，对接过程中采用集中监控和实时日志记录，实现对每一条写入操作的全面追踪与告警，是整个数据集成功能得以顺畅运行的重要保障。

上述步骤结合起来，使得整套流程不仅在技术上具备高度鲁棒性，还提升了业务层级上的透明度与管理精细度。接下来我们会深入讲解具体实施策略及相关代码示例，让您更好理解并应用这种高效场景下的数据集成方式。如何开发企业微信API接口

调用聚水潭·奇门接口获取并加工数据

在数据集成的生命周期中，调用源系统接口是至关重要的一步。本文将深入探讨如何通过轻易云数据集成平台调用聚水潭·奇门接口jushuitan.saleout.list.query来获取销售出库单数据，并对其进行初步加工。

接口调用配置

首先，我们需要配置接口调用的元数据。以下是jushuitan.saleout.list.query接口的元数据配置：

{
  "api": "jushuitan.saleout.list.query",
  "effect": "QUERY",
  "method": "POST",
  "number": "io_id",
  "id": "{io_id}{modified}",
  "name": "name",
  "idCheck": true,
  "request": [
    {
      "field": "page_index",
      "label": "页数",
      "type": "string",
      "describe": "第几页，从第一页开始，默认1",
      "value": "1"
    },
    {
      "field": "page_size",
      "label": "每页行数",
      "type": "string",
      "describe": "每页多少条，默认25，最大50",
      "value": "100"
    },
    {
      "field": "start_time",
      "label": "修改开始时间",
      "type": "string",
      "describe": "修改起始时间，和结束时间必须同时存在，时间间隔不能超过七天，与线上单号不能同时为空",
      "_function LEFT( '{{DAYS_AGO_1|datetime}}' , 10)"
    },
    {
      "field": "end_time",
      "label": "修改结束时间",
      "type": "string",
      "_function LEFT( '{{CURRENT_TIME|datetime}}' , 10)"
    },
    {
      "field": "status",
      "label": "",
      ""
    },
    {

请求参数解析

在配置中，我们定义了多个请求参数：

page_index: 页数，从第一页开始，默认值为1。
page_size: 每页行数，默认25条，最大50条。
start_time: 修改开始时间，通过函数获取前一天的日期。
end_time: 修改结束时间，通过函数获取当前日期。
status: 单据状态，可以是待出库、已出库或作废。

这些参数确保我们能够灵活地分页获取销售出库单，并根据特定的时间范围和状态过滤数据。

数据请求与清洗

在实际操作中，我们通过POST请求向jushuitan.saleout.list.query接口发送上述参数。以下是一个示例请求：

{
  "_function LEFT( '{{DAYS_AGO_1|datetime}}' , 10)",
  "_function LEFT( '{{CURRENT_TIME|datetime}}' , 10)",
}

响应的数据将包含多个字段，其中最重要的是items字段，它包含了具体的销售出库单信息。为了便于后续处理，我们可以利用轻易云平台提供的数据清洗功能，对响应的数据进行初步清洗。例如，可以将嵌套的JSON结构展平，将日期格式标准化等。

数据转换与写入

在完成数据请求与清洗后，我们需要将数据转换为目标系统所需的格式，并写入到BI狄菲俪诗的销售出库表中。这一步通常包括字段映射、数据类型转换以及必要的数据校验。

例如，将聚水潭中的io_id映射为目标系统中的订单编号，将日期字段转换为统一的格式等。这些操作可以通过轻易云平台提供的可视化界面来完成，无需编写复杂的代码。

实时监控与调试

在整个过程中，轻易云平台提供了实时监控和调试功能。我们可以随时查看数据流动情况、处理状态以及可能出现的错误。这极大地提升了数据集成过程的透明度和效率。

通过以上步骤，我们成功实现了从聚水潭·奇门接口获取销售出库单数据，并对其进行初步加工，为后续的数据分析和业务决策提供了可靠的数据基础。金蝶与外部系统打通接口

使用轻易云数据集成平台进行ETL转换并写入MySQL API接口的技术案例

在数据集成生命周期的第二步中，我们需要将已经集成的源平台数据进行ETL转换，转为目标平台 MySQL API 接口所能够接收的格式，并最终写入目标平台。本文将详细介绍如何利用轻易云数据集成平台实现这一过程。

元数据配置解析

元数据配置是整个ETL过程的核心，定义了如何从源系统提取数据、转换数据以及如何将其加载到目标系统中。以下是元数据配置的详细解析：

{
  "api": "batchexecute",
  "effect": "EXECUTE",
  "method": "SQL",
  "number": "id",
  "id": "id",
  "name": "id",
  "idCheck": true,
  ...
}

api: 指定API接口类型，这里使用的是batchexecute，表示批量执行SQL语句。
effect: 定义操作类型，这里是EXECUTE，表示执行操作。
method: 指定方法类型，这里是SQL，表示使用SQL语句进行操作。
number, id, name, idCheck: 用于唯一标识记录和进行ID校验。

请求字段配置

请求字段配置定义了从源系统提取的数据字段及其对应关系：

"request": [
  {"field":"id","label":"主键","type":"string","value":"{o_id}-{items_ioi_id}-{modified}"},
  {"field":"co_id","label":"公司编号","type":"string","value":"{co_id}"},
  {"field":"shop_id","label":"店铺编号","type":"string","value":"{shop_id}"},
  ...
]

每个字段包含以下属性：

field: 字段名称。
label: 字段标签，用于描述字段含义。
type: 字段类型，这里全部为string。
value: 从源系统提取的数据映射，例如 {o_id}-{items_ioi_id}-{modified} 表示组合字段。

主SQL语句配置

主SQL语句用于定义插入或更新操作的具体SQL语句：

"otherRequest": [
  {
    "field": "main_sql",
    "label": "主语句",
    "type": "string",
    "describe": "SQL首次执行的语句，将会返回:lastInsertId",
    "value": "REPLACE INTO saleout_list_query(id,co_id,shop_id,io_id,o_id,so_id,created,modified,status,invoice_title,shop_buyer_id,receiver_country,receiver_state,receiver_city,receiver_district,buyer_message,remark,is_cod,pay_amount,l_id,io_date,lc_id,stock_enabled,labels,paid_amount,free_amount,freight,weight,warehouse,drp_co_id_from,f_weight,order_type,open_id,is_print_express,is_print,drp_info,buyer_tax_no,logistics_company,sns_sku_id,sns_sn,merge_so_id,wms_co_id,items_i_id,items_sale_base_price,items_is_gift,items_oi_id,items_outer_oi_id,items_raw_so_id,items_pay_amount,items_combine_sku_id,items_ioi_id,items_sku_id,items_qty ,items_name ,items_properties_value ,items_sale_price ,items_sale_amount ,shop_name ,f_freight ,business_staff ,currency ,node ,pay_date ,seller_flag ,wave_id ,order_staff_id ,order_staff_name) VALUES"
  },
  {"field":"limit","label":"limit","type":"string","value":"1000"}
]

该配置中的main_sql字段定义了具体的插入或更新操作，使用的是REPLACE INTO语法，可以确保在存在相同主键时进行更新，不存在时进行插入。

数据转换与写入过程

提取数据：根据请求字段配置，从源系统提取相应的数据。例如，从聚水潭提取销售出库单相关信息。
转换数据：根据元数据配置中的映射关系，将提取的数据转换为目标系统所需格式。例如，将 {o_id}-{items_ioi_id}-{modified} 转换为合适的主键格式。
加载数据：使用主SQL语句，将转换后的数据批量写入到目标MySQL数据库中。通过执行配置中的main_sql语句，实现对目标表saleout_list_query的插入或更新操作。

实践案例

假设我们从聚水潭系统中提取了一条销售出库单记录，其部分原始数据如下：

{
  "o_id": "12345",
  "co_id": "67890",
  ...
}

根据元数据配置，我们需要将其转换并写入到MySQL数据库中。具体步骤如下：

提取并组合主键：
- 原始值：o_id = 12345, items_ioi_id = ABCD, modified = 2023-10-01
- 转换后主键：12345-ABCD-2023-10-01

构建插入/更新语句：

SQL:

REPLACE INTO saleout_list_query(id,...)
VALUES ('12345-ABCD-2023-10-01', '67890', ...)

执行批量插入/更新：
- 使用API接口执行上述SQL语句，将记录写入到MySQL数据库中。

通过上述步骤，我们成功地完成了从聚水潭到BI狄菲俪诗销售出库表的数据ETL转换和写入过程。这一过程充分利用了轻易云数据集成平台提供的全生命周期管理功能，实现了高效、透明的数据处理和监控。用友与WMS系统接口开发配置