轻易云ETL技术详解:从用友BIP数据转换到目标平台

  • 轻易云集成顾问-陈洁琳

2B-YS销售单查询-成功:用友BIP数据集成到轻易云集成平台

在进行企业级系统对接时,准确、高效的数据集成尤为关键。本案例重点分享如何利用轻易云数据集成平台与用友BIP进行无缝联接,实现2B-YS销售单的高效查询。我们将直接切入技术细节,展示通过API接口实现这一目标的一系列操作。

用友BIP API获取销售单数据

首先,通过调用用友BIP提供的API /buly7upu/commonProductCls/commonProduct/saleOrderList,可以批量获取所需的销售信息。这一步需要处理分页和限流问题,以确保大量数据能够顺利抓取并且不出现漏单现象。

GET /buly7upu/commonProductCls/commonProduct/saleOrderList
Host: api.yonyou.com
Authorization: Bearer <access_token>

在这个过程中,我们借助轻易云强大的定时任务功能,实现了对用友BIP接口数据的定时、可靠抓取。这不仅提升了数据同步效率,同时也保证了实时性。

高吞吐量写入至轻易云集成平台

为了确保从用友BIP获取的大量销售信息能够快速而高效地写入到轻易云中,我们使用了其支持高吞吐量的数据写入能力。以下示例代码展示了如何通过API将获得的数据写入轻易云:

POST /api/data/write
Host: api.qingyiyun.com
Content-Type: application/json
{
    "data": [
        {
            "orderID": "12345",
            "productName": "XYZ",
            ...
        },
        ...
    ]
}

这种方式极大地提升了业务处理时效性,并且由于可视化的数据流设计工具,使得整个过程更加直观和便于管理。在此期间,如果遇到任何异常情况,内置的错误重试机制和异常处理流程也会自动触发,从而保障整体操作的稳定性。

通过这样的设置,不仅实现了两大系统间数据无缝衔接,还充分运用了集中监控和告警系统,对整个数据传输链路状态进行实时跟踪,为后续维护及优化提供有力支持。

接下来,让我们深入探讨具体实施方案及各项细节配置…… 打通用友BIP数据接口

调用用友BIP接口获取并加工数据的技术案例

在数据集成生命周期的第一步中,调用源系统接口并获取数据是至关重要的。本文将详细探讨如何通过轻易云数据集成平台调用用友BIP接口/buly7upu/commonProductCls/commonProduct/saleOrderList,并对返回的数据进行加工处理。

接口调用配置

首先,我们需要配置API请求参数。根据元数据配置,我们使用POST方法来调用该接口,并传递必要的请求参数。这些参数包括页码、每页行数、单据编码、订单状态等。以下是具体的请求参数配置:

{
  "pageIndex": "1",
  "pageSize": "50",
  "code": "UO-20220513000001",
  "nextStatusName": "DELIVERGOODS",
  "open_orderDate_begin": "2022-05-13 00:00:00",
  "open_orderDate_end": "2022-05-13 23:59:59",
  "open_hopeReceiveDate_begin": "2022-05-13 00:00:00",
  "open_hopeReceiveDate_end": "2022-05-13 23:59:59",
  "open_vouchdate_begin": "{{DAYS_AGO_3|date}}",
  "open_vouchdate_end": "{{CURRENT_TIME|date}}",
  "isSum": "false",
  "simpleVOs": {
    "field2": {
      "field": "auditTime",
      "op": "between",
      "value1": "{{DAYS_AGO_s10|datetime}}",
      "value2": "{{CURRENT_TIME|datetime}}"
    },
    "field3": {
      "field": "transactionTypeId",
      "op": "eq",
      "value1": "1654615828039467012"
    }
  }
}

数据格式化与转换

在获取到原始数据后,需要对其进行格式化和转换,以便后续处理和分析。根据元数据配置,我们需要对以下字段进行重命名和格式转换:

  • stockId 转换为 new_stockId
  • pubuts 转换为 date_pubuts(日期格式)
  • id 转换为 new_id
  • orderDetailId 转换为 new_orderDetailId
  • oriTaxUnitPrice 转换为 new_oriTaxUnitPrice

以下是一个示例代码片段,展示了如何进行这些字段的转换:

def format_response(data):
    formatted_data = []
    for item in data:
        formatted_item = {
            'new_stockId': str(item.get('stockId', '')),
            'date_pubuts': parse_date(item.get('pubuts', '')),
            'new_id': str(item.get('id', '')),
            'new_orderDetailId': str(item.get('orderDetailId', '')),
            'new_oriTaxUnitPrice': str(item.get('oriTaxUnitPrice', ''))
        }
        formatted_data.append(formatted_item)
    return formatted_data

def parse_date(date_str):
    # 假设日期格式为 yyyy-MM-dd HH:mm:ss
    from datetime import datetime
    return datetime.strptime(date_str, '%Y-%m-%d %H:%M:%S').isoformat()

数据清洗与验证

在完成字段转换后,还需要对数据进行清洗和验证。例如,确保所有必填字段都存在且符合预期格式。如果某些字段缺失或格式不正确,可以记录日志或抛出异常,以便及时发现问题。

def validate_data(data):
    for item in data:
        if not item['new_stockId']:
            raise ValueError("Missing stock ID")
        if not item['date_pubuts']:
            raise ValueError("Invalid date format")
        # 添加更多验证规则...

# 调用函数进行数据清洗与验证
formatted_data = format_response(raw_data)
validate_data(formatted_data)

自动填充响应

根据元数据配置,我们可以启用自动填充响应功能,这样可以简化部分手动操作。在轻易云平台中,可以通过设置autoFillResponse属性为true来实现这一功能。

{
  ...
  "autoFillResponse": true
}

通过上述步骤,我们成功地调用了用友BIP接口获取销售订单列表,并对返回的数据进行了格式化、转换和验证。这一过程不仅提高了数据处理的效率,还确保了数据的准确性和一致性,为后续的数据分析和业务决策提供了可靠的基础。 如何开发企业微信API接口

轻易云数据集成平台ETL转换与写入技术案例

在数据集成的过程中,ETL(Extract, Transform, Load)是关键步骤之一。本文将详细探讨如何利用轻易云数据集成平台,将已经集成的源平台数据进行ETL转换,并最终通过API接口写入目标平台。

数据请求与清洗

在数据请求阶段,我们从源系统获取原始数据。这些数据可能来自不同的异构系统,需要经过清洗和标准化处理,以确保数据的一致性和准确性。清洗过程包括去除重复项、处理缺失值以及格式化日期等操作。

数据转换

一旦数据被清洗完毕,下一步就是将其转换为目标平台所能接受的格式。在本案例中,我们需要将源平台的数据转换为轻易云集成平台API接口所能够接收的格式。

假设我们从源系统获取了一组销售单数据,这些数据包含以下字段:

  • 销售单号(order_id)
  • 客户名称(customer_name)
  • 商品列表(items)
  • 总金额(total_amount)
  • 销售日期(sale_date)

我们需要将这些字段映射到目标平台所需的字段格式。例如,目标平台可能要求字段名为orderIDcustomerNameitemListtotalAmountsaleDate。此外,日期格式可能需要从“YYYY-MM-DD”转换为“DD/MM/YYYY”。

def transform_data(source_data):
    transformed_data = []
    for record in source_data:
        transformed_record = {
            "orderID": record["order_id"],
            "customerName": record["customer_name"],
            "itemList": record["items"],
            "totalAmount": record["total_amount"],
            "saleDate": convert_date_format(record["sale_date"])
        }
        transformed_data.append(transformed_record)
    return transformed_data

def convert_date_format(date_str):
    from datetime import datetime
    date_obj = datetime.strptime(date_str, "%Y-%m-%d")
    return date_obj.strftime("%d/%m/%Y")

数据写入

完成数据转换后,我们需要通过API接口将这些数据写入目标平台。根据元数据配置,API接口的相关信息如下:

{
  "api": "写入空操作",
  "effect": "EXECUTE",
  "method": "POST",
  "idCheck": true
}

这意味着我们需要向目标平台发送一个POST请求,并且在发送之前进行ID检查以确保每条记录的唯一性。

import requests

def write_to_target_platform(transformed_data):
    api_url = "https://api.qingyiyun.com/write"
    headers = {
        'Content-Type': 'application/json'
    }

    for record in transformed_data:
        if id_check(record["orderID"]):
            response = requests.post(api_url, json=record, headers=headers)
            if response.status_code == 200:
                print(f"Record {record['orderID']} written successfully.")
            else:
                print(f"Failed to write record {record['orderID']}. Status code: {response.status_code}")
        else:
            print(f"Record {record['orderID']} failed ID check.")

def id_check(order_id):
    # Implement ID check logic here
    # For example, query the target platform to see if the order_id already exists
    return True

实时监控与调试

在整个ETL过程中,实时监控和调试是确保数据准确性的关键。轻易云提供了全透明可视化的操作界面,可以实时监控每个环节的数据流动和处理状态。如果出现错误或异常情况,可以及时发现并进行修正。

通过以上步骤,我们实现了从源系统到目标平台的数据无缝对接。利用轻易云数据集成平台强大的ETL功能,可以大大提升业务流程的效率和透明度。 打通金蝶云星空数据接口