轻易云平台上的数据ETL转换与目标平台写入详解

2021-01-23 17:19:11
轻易云集成顾问-冯潇

用友BIP数据集成到轻易云集成平台案例分享：仓库查询-v

在本案例中，我们将详细解析如何通过轻易云数据集成平台，实现用友BIP的仓库数据高效对接，确保全流程无缝衔接和高质量的数据传输。该方案具体命名为“仓库查询-v”，主要涉及从用友BIP接口/yonbip/digitalModel/warehouse/list抽取数据，并批量写入到轻易云集成平台，以满足业务需求。

API调用与配置概述

首先，通过用友BIP提供的API接口'/yonbip/digitalModel/warehouse/list'进行抓取。这一步骤确保了我们能够实时获取最新的仓库信息。在实施过程中，需要特别关注接口分页及限流问题，这是保证大规模数据读取稳定性的关键。

数据抓取与写入策略

为了提升效率，本次采用定时任务机制，每小时自动调用一次API，从而实现定时可靠地抓取和更新数据。而针对大量数据的处理，为避免系统瓶颈，我们使用了分批次快速写入的方法，将获取的数据依次提交到轻易云集成平台，充分利用其强大的并行处理能力，保障每个步骤都能顺利进行。

数据格式转换与映射

由于来源于用友BIP的数据格式与目标系统要求存在差异，在存入前必须进行适当转换。通过定制化的数据映射工具，对不同字段进行了精确匹配，同时制定了异常处理机制，一旦发现不匹配或错误，即触发重试功能，再度尝试直到成功记录。

下一步内容将深入探讨各技术环节的具体实现，希望为同类需求提供参考范例。用友与CRM系统接口开发配置

用友BIP接口/yonbip/digitalModel/warehouse/list数据集成与加工

在数据集成生命周期的第一步，我们需要调用用友BIP接口/yonbip/digitalModel/warehouse/list获取仓库数据，并对其进行初步加工。以下是详细的技术实现过程。

调用接口获取数据

首先，我们需要配置请求参数来调用用友BIP的仓库查询接口。根据提供的元数据配置，接口采用POST方法，以下是请求参数的详细说明：

{
  "pageSize": "10",
  "pageIndex": "1",
  "code": "12212",
  "regionCode": "110108000000",
  "wStore": "false",
  "iUsed": "enable",
  "org": ["1511042233094400"],
  "simple": {
    "pubts": "{{LAST_SYNC_TIME|datetime}}",
    "name": "仓库1"
  }
}

请求参数解析与设置

pageSize 和 pageIndex 分别表示每页行数和当前页数，默认值为10和1。
code 是仓库编码，用于精确查询特定仓库。
regionCode 表示行政区划编码，例如北京市海淀区编码为110108000000。
wStore 表示是否为门店仓，取值为布尔类型字符串，如"true"或"false"。
iUsed 表示状态，可以是启用（enable）或停用（disable）。
org 是库存组织ID，需要转换为数组格式。
simple 是扩展查询对象，其中包含时间戳（pubts）和仓库名称（name）。

数据请求与清洗

在获取到原始数据后，我们需要对其进行清洗和格式化。根据元数据配置中的formatResponse，我们将原始字段名id转换为新的字段名new_id，并将其格式化为字符串类型。

以下是一个示例响应数据及其处理过程：

{
  "data": [
    {
      "id": 12345,
      "name": "仓库1",
      // ...其他字段
    },
    // ...更多记录
  ]
}

处理后的数据格式如下：

{
  "data": [
    {
      "new_id": "12345",
      "name": "仓库1",
      // ...其他字段
    },
    // ...更多记录
  ]
}

实现代码示例

以下是一个简单的Python代码示例，用于演示如何调用接口并处理响应数据：

import requests
import json

# 配置请求参数
payload = {
    "pageSize": "10",
    "pageIndex": "1",
    "code": "12212",
    "regionCode": "110108000000",
    "wStore": False,
    "iUsed": 'enable',
    'org': ["1511042233094400"],
    'simple': {
        'pubts': '2020-08-29 10:49:17',
        'name': '仓库1'
    }
}

# 发起POST请求
response = requests.post("https://api.yonyou.com/yonbip/digitalModel/warehouse/list", json=payload)

# 检查响应状态码
if response.status_code == 200:
    data = response.json()

    # 清洗和格式化数据
    for item in data['data']:
        item['new_id'] = str(item.pop('id'))

    # 输出处理后的数据
    print(json.dumps(data, indent=4, ensure_ascii=False))
else:
    print(f"请求失败，状态码：{response.status_code}")

通过上述步骤，我们成功地调用了用友BIP的接口获取仓库数据，并进行了必要的数据清洗和格式化，为后续的数据转换与写入奠定了基础。这一过程展示了轻易云平台在异构系统集成中的强大能力，使得不同系统间的数据交互变得更加高效和透明。如何对接钉钉API接口

利用轻易云数据集成平台进行ETL转换并写入目标平台

在数据集成的生命周期中，ETL（提取、转换、加载）过程是将源平台的数据转换为目标平台所需格式的关键步骤。本文将详细探讨如何使用轻易云数据集成平台，将已经集成的源平台数据进行ETL转换，并通过API接口写入目标平台。

数据请求与清洗

在进入ETL转换之前，首先需要完成数据的请求与清洗。这一步通常包括从源系统获取原始数据，并对这些数据进行初步处理，如去重、格式化和校验等。假设我们已经完成了这一阶段，接下来我们重点关注如何将清洗后的数据进行转换并写入目标平台。

数据转换与写入

轻易云数据集成平台提供了丰富的API接口和灵活的元数据配置，使得我们可以高效地完成数据转换和写入操作。以下是一个具体的技术案例，展示如何利用元数据配置将仓库查询结果写入目标平台。

元数据配置解析

在本案例中，我们的元数据配置如下：

{
  "api": "写入空操作",
  "method": "POST",
  "idCheck": true
}

api: 指定了目标API接口名称，这里为“写入空操作”。
method: 指定HTTP请求方法，这里为POST。
idCheck: 一个布尔值，指示是否需要进行ID检查。

转换逻辑实现

提取源数据：假设我们已经从仓库查询中获得了如下结构的数据：

[
  {"item_id": "123", "quantity": 10, "location": "A1"},
  {"item_id": "124", "quantity": 20, "location": "B2"}
]

定义转换规则：根据目标API接口要求，我们需要将上述数据转换为如下格式：

{
  "items": [
    {"id": "123", "qty": 10, "loc": "A1"},
    {"id": "124", "qty": 20, "loc": "B2"}
  ]
}

实现转换逻辑：可以使用Python或其他编程语言来实现这一逻辑。以下是一个Python示例代码：

def transform_data(source_data):
    transformed_data = {"items": []}
    for item in source_data:
        transformed_item = {
            "id": item["item_id"],
            "qty": item["quantity"],
            "loc": item["location"]
        }
        transformed_data["items"].append(transformed_item)
    return transformed_data

source_data = [
  {"item_id": "123", "quantity": 10, "location": "A1"},
  {"item_id": "124", "quantity": 20, "location": "B2"}
]

transformed_data = transform_data(source_data)
print(transformed_data)

调用API接口：使用HTTP客户端（如requests库）将转换后的数据通过POST方法发送到目标API接口。

import requests

url = 'https://api.qingyiyun.com/write'

headers = {
    'Content-Type': 'application/json'
}

response = requests.post(url, json=transformed_data, headers=headers)

if response.status_code == 200:
    print("Data successfully written to target platform.")
else:
    print(f"Failed to write data: {response.status_code}, {response.text}")

ID检查机制

如果元数据配置中的idCheck设置为true，在调用API接口之前，需要确保每个记录都包含有效的ID。这可以通过简单的验证函数来实现：

def validate_ids(data):
    for item in data["items"]:
        if not item.get("id"):
            raise ValueError("Missing ID in one of the items")

validate_ids(transformed_data)

在实际应用中，可以结合上述代码片段，实现从提取、转换到最终写入的一整套流程。通过合理利用轻易云的数据集成平台及其提供的API接口，我们能够高效地完成复杂的数据集成任务，确保业务系统间的数据流动顺畅无阻。数据集成平台可视化配置API接口