数据集成ETL过程及API写入关键步骤

2022-03-26 07:09:28
轻易云集成顾问-杨嫦

用友YS数据集成至轻易云平台：中转库存明细账接收案例分享

在复杂的企业系统环境中，数据对接和集成是提高业务效率、确保信息一致性的重要环节。本文将聚焦于一个具体技术案例，即通过轻易云数据集成平台实现用友YS系统中转库存明细账的稳定、高效同步。

数据源与目标 API 简介

首先，需要了解两个核心接口：

用友YS获取数据的API：
- /mdf-node/uniform/report/list?terminalType=1
- 该接口用于从用友YS系统提取最新的库存明细。
轻易云写入数据的API：
- 写入空操作
- 提供高吞吐量的数据写入能力，使得大量来自用友YS的数据能够快速导入，提高处理时效性。

关键技术要点解析

高速稳定的数据抓取机制

为了确保从用友YS系统定时可靠地抓取到所需数据，我们制定了严谨的数据获取策略。利用轻易云平台提供的集中监控和告警功能，可实时跟踪每个定时任务执行情况，如遇异常，告警机制能够迅速响应并协助排查问题。这有效避免了漏单现象发生。

批量处理与分页优化

考虑到需要处理的大量库存明细账记录，尤其是在月末或季度末这种业务高峰期，我们特别关注如何进行批量操作以及处理API请求分页限流的问题。在实际运行过程中，通过合理设定分页参数并结合批量提交方案，实现了在有限时间窗口内完成大规模记录的抓取和写入。

定制化转换逻辑及格式适配

由于两大平台之间可能存在的数据格式差异，自定义转换逻辑显得尤为关键。例如，从用友YS提取出来的是JSON格式，而目的存储要求另一定义结构，这就需要我们设计灵活且可靠的数据映射规则，以满足不同字段间的一一对应关系。此外，还要对部分特殊字段进行预处理，如日期格式、一致性校验等，保证最终落地数据精确无误。

异常检测及重试机制

面对网络波动、接口超时等潜在风险，我们引入了成熟的异常检测模式，并附加错误重试机制。一旦发觉某次请求失败，不会立即放弃，而是根据设定规则再尝试几次（带有延迟退避算法），极大提升了整体任务成功率。同时，通过日志记录与实时监控，可以清晰追溯每一步操作，为后续优化迭代提供宝贵参考依据。

这只是项目实施中的一些概要描述，在系统集成平台API接口配置

调用用友YS接口获取并加工数据的技术案例

在数据集成过程中，调用源系统的API接口是关键的一步。本文将详细探讨如何通过轻易云数据集成平台调用用友YS接口/mdf-node/uniform/report/list?terminalType=1，并对返回的数据进行加工处理。

接口调用配置

首先，我们需要配置元数据以正确调用用友YS的API接口。以下是元数据配置的详细信息：

{
  "api": "/mdf-node/uniform/report/list?terminalType=1",
  "effect": "QUERY",
  "method": "POST",
  "number": "{random}",
  "id": "{random}",
  "idCheck": true,
  "request": [
    {
      "field": "org",
      "label": "org",
      "type": "string",
      "value": "1481709712348020740,1481709712348020741,1481709712348020742",
      "parser": {
        "name": "StringToArray",
        "params": ","
      }
    },
    {
      "field": "startvouchdate",
      "label": "startvouchdate",
      "type": "string",
      "value": "2023-12-01 00:00:00"
    },
    {
      "field": "endvouchdate",
      "label": "endvouchdate",
      "type": "string",
      "value": "_function DATE_FORMAT(DATE_SUB('{{CURRENT_TIME|datetime}}', INTERVAL 1 DAY), '%Y-%m-%d 23:59:59')"
    },
    {
      "field": "仓库",
      ...
    }
  ]
}

请求参数解析

org：组织字段，值为多个组织ID的字符串，通过StringToArray解析器将其转换为数组。
startvouchdate：起始凭证日期，固定值为2023-12-01 00:00:00。
endvouchdate：结束凭证日期，动态计算为当前时间前一天的23:59:59。
仓库、物料、期间类型、期间范围、查询对象、维度导航方案等字段均为固定值，用于指定查询条件。

数据请求与清洗

在发送POST请求时，我们需要确保请求体包含上述所有字段，并且字段值符合API要求。以下是一个示例请求体：

{
  "org": ["1481709712348020740", "1481709712348020741", "1481709712348020742"],
  ...
}

发送请求后，我们会收到一个JSON格式的响应数据。接下来，需要对响应数据进行清洗和转换，以便后续处理和写入目标系统。

数据转换与写入

在数据转换阶段，我们需要根据业务需求对原始数据进行处理。例如，将日期格式统一、过滤无效记录、计算新增字段等。以下是一个简单的数据转换示例：

import json
from datetime import datetime, timedelta

# 假设response_data是从API获取的原始数据
response_data = {...}

# 清洗和转换数据
cleaned_data = []
for record in response_data['data']:
    # 转换日期格式
    record['formatted_date'] = datetime.strptime(record['date'], '%Y-%m-%d %H:%M:%S').strftime('%Y-%m-%d')

    # 添加新的计算字段
    record['new_field'] = calculate_new_field(record)

    cleaned_data.append(record)

# 将清洗后的数据写入目标系统
write_to_target_system(cleaned_data)

小结

通过轻易云数据集成平台，我们可以高效地调用用友YS接口获取所需数据，并对其进行清洗和转换。这一过程不仅简化了复杂的数据处理任务，还提高了业务透明度和效率。在实际应用中，根据具体业务需求进一步优化和定制化处理逻辑，是确保集成成功的关键。如何对接用友BIP接口

数据集成生命周期中的ETL转换与写入

在数据集成的生命周期中，ETL（提取、转换、加载）过程是将源平台的数据转换为目标平台所能接收的格式的关键步骤。本文将详细探讨如何利用轻易云数据集成平台将中转库存明细账数据进行ETL转换，并通过API接口写入目标平台。

数据请求与清洗

首先，我们需要从源平台获取中转库存明细账数据。假设我们已经完成了数据请求与清洗阶段，得到了结构化的原始数据。这些数据可能包含多个字段，如库存编号、产品名称、数量、仓库位置等。在这一阶段，我们确保了数据的准确性和完整性，为后续的转换和写入打下基础。

数据转换

在数据转换阶段，我们需要将清洗后的数据按照目标平台的要求进行格式转换。轻易云集成平台提供了强大的转换工具，可以对数据进行各种复杂的操作，包括字段映射、类型转换、值替换等。

例如，假设我们从源平台获取到的数据格式如下：

{
  "inventory_id": "12345",
  "product_name": "Widget A",
  "quantity": 100,
  "warehouse_location": "A1"
}

而目标平台要求的数据格式为：

{
  "id": "12345",
  "name": "Widget A",
  "qty": 100,
  "location": "A1"
}

我们可以通过轻易云集成平台的元数据配置功能来实现这一转换。具体配置如下：

{
  "source_field": "inventory_id",
  "target_field": "id"
},
{
  "source_field": "product_name",
  "target_field": "name"
},
{
  "source_field": "quantity",
  "target_field": "qty"
},
{
  "source_field": "warehouse_location",
  "target_field": "location"
}

通过上述配置，我们能够将源数据字段准确地映射到目标字段，从而满足目标平台的要求。

数据写入

完成数据转换后，下一步就是将这些转换后的数据写入到目标平台。在这里，我们使用轻易云集成平台提供的API接口来实现这一操作。根据元数据配置，我们需要调用一个名为“写入空操作”的API接口，其具体配置如下：

{
  "api":"写入空操作",
  "effect":"EXECUTE",
  "method":"POST",
  "idCheck":true
}

该API接口使用HTTP POST方法，将处理后的数据发送到目标平台。在实际应用中，我们可以编写一个简单的脚本来执行这一操作。例如，使用Python语言，可以通过以下代码实现：

import requests
import json

# 转换后的数据
data = {
    "id": "12345",
    "name": "Widget A",
    "qty": 100,
    "location": "A1"
}

# API接口配置
url = 'https://api.qingyiyun.com/write'
headers = {'Content-Type': 'application/json'}
payload = json.dumps(data)

# 执行POST请求
response = requests.post(url, headers=headers, data=payload)

# 检查响应状态
if response.status_code == 200:
    print("Data written successfully")
else:
    print("Failed to write data:", response.text)

在上述代码中，我们首先定义了要写入的数据，然后根据元数据配置构建了HTTP POST请求，并将请求发送到指定的API接口URL。如果响应状态码为200，则表示数据成功写入，否则输出错误信息。

实践案例

为了更好地理解这一过程，让我们来看一个实际案例。假设我们有一批中转库存明细账的数据，需要将其批量导入到目标平台。我们可以按照以下步骤进行操作：

提取与清洗：从源系统提取原始库存明细账数据，并进行必要的数据清洗。
批量转换：利用轻易云集成平台，将所有记录按照预定义的字段映射规则进行批量转换。
批量写入：使用API接口，将所有转换后的记录一次性POST到目标平台。

通过这种方式，我们能够高效地完成大规模的数据集成任务，确保每一条记录都能准确无误地导入到目标系统中。

综上所述，通过合理利用轻易云集成平台提供的ETL工具和API接口，我们能够高效地完成从源系统到目标系统的数据集成任务，实现不同系统间的数据无缝对接。用友与WMS系统接口开发配置