轻易云数据集成平台中的ETL转换：将数据写入金蝶云星辰V2

2021-11-17 06:44:52
轻易云集成顾问-彭萍

汤臣倍健营销云数据集成到金蝶云星辰V2：退货入库案例分享

在本文中，我们将详细探讨如何通过轻易云数据集成平台，将汤臣倍健营销云的退货入库（Life-Space）杭州益倍盛的数据，高效、准确地对接至金蝶云星辰V2系统。我们将重点关注以下几个技术难点和解决方案：

首先，确保从汤臣倍健营销云获取的订单数据不漏单是整个流程中至关重要的一步。在这一环节，我们利用定时可靠的抓取机制，通过/erp/api/order/query/saleReturnOrder接口，准时收集销售退货订单信息。

然后，对于大量订单数据的处理与写入，借助批量操作加以应对。通过调用金蝶云星辰V2提供的/jdy/v2/scm/sal_in_bound API，实现高效、快速地大规模写入。这不仅缩短了数据同步时间，还保证了系统资源的最佳利用。

此外，在实际操作过程中，我们还需考虑数据格式差异的问题。为此，我们进行了详尽的数据映射和转换规则配置，使得不同系统间的数据能够无缝衔接。同时，为防止由于分页限制带来的请求超出问题，对API接口进行了合理调优，以满足业务需求。

特别值得一提的是，面对可能出现的对接异常情况，如网络波动或服务暂不可用等情形，实现了一致性强的大型分布式重试机制。这使得即便在环境波动较大情况下，也能最大程度上保证任务成功率及业务连续性。

最后，通过全生命周期管理技术，包括实时监控与日志记录，让所有关键步骤都有可追溯和透明化处理路径，从而进一步提升整体项目实施效果和客户满意度。用友与外部系统接口集成开发

调用源系统汤臣倍健营销云接口/erp/api/order/query/saleReturnOrder获取并加工数据

在轻易云数据集成平台中，调用源系统接口是数据处理生命周期的第一步。本文将详细探讨如何通过调用汤臣倍健营销云的API接口/erp/api/order/query/saleReturnOrder来获取退货入库数据，并对其进行初步加工。

接口配置与请求参数

该接口采用POST方法进行数据请求，主要用于查询销售退货订单。以下是元数据配置中的关键字段及其含义：

tenantId：经销商ID，必填项，用于标识具体的经销商。
yxyNumber：营销云销售订单号，传此参数时其他条件无效。
number：系统订单号，传此参数时其他条件无效。
status：订单状态，0表示未审核，1表示已审核（已出库）。
beginTime和endTime：时间范围，用于查询特定时间段内的订单。
pageNo和pageSize：分页参数，默认值分别为1和30。
timeType：时间段标志，0表示基于创建时间查询，1表示基于更新时间查询。

请求示例：

{
  "tenantId": "34cc4109705e4c058b7b3b0352e57d31",
  "status": "1",
  "beginTime": "{{LAST_SYNC_TIME|datetime}}",
  "endTime": "{{CURRENT_TIME|datetime}}",
  "pageNo": "1",
  "pageSize": "30",
  "timeType": "1"
}

数据请求与清洗

在发送请求后，我们会收到一个包含多个销售退货订单的响应。为了确保数据的准确性和一致性，需要对原始数据进行清洗和预处理。以下是一些常见的数据清洗步骤：

字段验证：检查每个字段是否符合预期格式，例如日期格式、数值范围等。
缺失值处理：对于必填字段，如果存在缺失值，需要进行补全或剔除操作。
重复数据处理：检查并移除重复记录，以避免数据冗余。

示例代码：

import requests
import json

# 定义请求URL和头信息
url = 'https://api.example.com/erp/api/order/query/saleReturnOrder'
headers = {'Content-Type': 'application/json'}

# 构建请求体
payload = {
    "tenantId": "34cc4109705e4c058b7b3b0352e57d31",
    "status": "1",
    "beginTime": "{{LAST_SYNC_TIME|datetime}}",
    "endTime": "{{CURRENT_TIME|datetime}}",
    "pageNo": "1",
    "pageSize": "30",
    "timeType": "1"
}

# 发送POST请求
response = requests.post(url, headers=headers, data=json.dumps(payload))

# 检查响应状态码
if response.status_code == 200:
    data = response.json()
    # 数据清洗逻辑
    cleaned_data = []
    for order in data['orders']:
        if validate_order(order):
            cleaned_data.append(order)
else:
    print(f"Error: {response.status_code}")

数据转换与写入

经过清洗后的数据需要进一步转换，以适应目标系统的要求。这可能包括字段重命名、格式转换等操作。最终，将处理好的数据写入目标数据库或系统中。

示例代码：

def transform_order(order):
    return {
        'order_id': order['id'],
        'order_number': order['number'],
        'status': order['status'],
        'created_at': order['createTime'],
        # 更多字段转换...
    }

transformed_data = [transform_order(order) for order in cleaned_data]

# 将转换后的数据写入目标数据库（示例）
import sqlite3

conn = sqlite3.connect('target.db')
cursor = conn.cursor()

for order in transformed_data:
    cursor.execute("""
        INSERT INTO sale_return_orders (order_id, order_number, status, created_at)
        VALUES (?, ?, ?, ?)
    """, (order['order_id'], order['order_number'], order['status'], order['created_at']))

conn.commit()
conn.close()

通过上述步骤，我们完成了从调用汤臣倍健营销云接口获取销售退货订单，到对数据进行清洗、转换并写入目标系统的全过程。这一过程不仅确保了数据的一致性和准确性，还提高了业务流程的透明度和效率。钉钉与WMS系统接口开发配置

轻易云数据集成平台中的ETL转换：实现数据写入金蝶云星辰V2 API接口

在数据集成的过程中，ETL（Extract, Transform, Load）是关键的一步。本文将详细探讨如何使用轻易云数据集成平台，将已经集成的源平台数据进行ETL转换，转为金蝶云星辰V2 API接口所能够接收的格式，并最终写入目标平台。

接口配置与请求参数

首先，我们需要了解金蝶云星辰V2 API接口的配置和请求参数。根据提供的元数据配置，目标API为/jdy/v2/scm/sal_in_bound，请求方法为POST。以下是主要字段及其描述：

bill_source: 来源，固定值ISV
bill_date: 出库日期，格式为YYYY-MM-DD
customer_id: 客户ID，通过查询外部系统获取
remark: 单据备注，包括上传附件URL和营销云信息
contact_address: 联系信息-详细地址
contact_linkman: 联系信息-联系人
contact_phone: 联系信息-联系方式
dept_number: 部门编码，固定值BM00006
material_entity: 商品分录，包括商品ID、仓库ID、数量、含税单价等详细信息

数据转换逻辑

在进行ETL转换时，需要特别注意以下几点：

日期格式转换：
- 出库日期bill_date需要从源数据中提取并转换为YYYY-MM-DD格式。
```
"bill_date": "{{auditTime|date}}"
```

客户ID映射：

通过外部系统查询客户ID。

"customer_id": "_findCollection find id from b41660e7-fa00-318f-bbee-1395e229ee6b where number={extCusCode}"

备注拼接：
- 将备注信息与营销云信息拼接形成新的备注字段。
```
"remark": "{remark}-来自营销云-{number}"
```

商品分录处理：

商品分录是一个数组，每个商品项都包含多个字段，如商品ID、仓库ID、数量、含税单价等。

"material_entity": [
{
   "material_id": "_findCollection find id from 395d1591-aee0-3f10-ad09-d5593167af48 where number={extMaterialNo}",
   "stock_id": "1320321952434404352",
   "qty": "{{itemList.opernumber}}",
   "tax_price": "{{itemList.taxunitprice}}",
   "is_free": false,
   "unit_id": "_findCollection find base_unit_id from 395d1591-aee0-3f10-ad09-d5593167af48 where number={extMaterialNo}",
   "batch_no": "{{itemList._Flot}}",
   "comment": "{{itemList.remark}}",
   "kf_date": "{{itemList._Fmfg}}",
   "valid_date": "{{itemList._Fexp}}",
   "kf_period": "730",
   "kf_type": "1"
}
]

实际操作步骤

提取数据：从源系统中提取需要的数据，这一步通常已经在生命周期的第一阶段完成。
清洗和转换数据：根据上述逻辑，对提取的数据进行清洗和转换。使用轻易云的数据处理工具，可以方便地对每个字段进行相应的处理。

构建请求体：将清洗和转换后的数据按照金蝶云星辰V2 API接口要求的格式构建请求体。

{
    "bill_source": "ISV",
    "bill_date": "{{auditTime|date}}",
    ...
    "material_entity": [
        {
            ...
        }
    ]
}

发送请求：使用POST方法将构建好的请求体发送到金蝶云星辰V2 API接口。

注意事项

错误处理：在实际操作中，需要对每一步骤进行错误处理。例如，如果客户ID查询失败，需要记录日志并采取相应措施。
性能优化：对于大批量数据处理，可以考虑批量提交或者异步处理，以提高性能。

通过以上步骤，我们可以高效地将源平台的数据经过ETL转换后，写入到金蝶云星辰V2 API接口，从而实现不同系统间的数据无缝对接。这不仅提升了业务透明度和效率，也确保了数据的一致性和准确性。如何开发钉钉API接口