用友BIP数据集成平台中数据处理介绍

用友BIP接口调用与数据清洗技术详解

2024-09-30 00:34:40
轻易云集成顾问-吕修远

用友BIP数据集成：网店与客户/组织映射关系

在企业信息系统的整合过程中，数据的无缝对接和高效处理是至关重要的一环。本文将详述一个基于轻易云数据集成平台，实现用友BIP数据到轻易云平台的数据对接案例——"网店与客户/组织映射关系-v"。

该方案旨在确保从用友BIP获取到的数据能够快速、安全地写入到轻易云集成平台，并实现两者之间的数据格式转换及兼容。此外，整个数据流转过程需要具备强大的实时监控能力和可靠的错误重试机制，以保证业务连续性。

为此，我们使用了以下API接口：

用友BIP获取数据API：

/fc0dltfc/qeasy_datahub/qeasy_datahub/query_mapping_shop

轻易云集成平台写入数据API：
```
wdt.purchase.provider.create
```

一、确保集成用友BIP数据不漏单

为了避免遗漏任何关键的业务订单，我们引入了一种定时且可靠的方法，从用友BIP接口定期抓取所需的数据。在具体实施中，这包括设定合理的调度频率，以及利用高级别异常处理和重试机制来应对网络波动或服务暂时不可用等问题。通过这样的设计，可以最大限度地保障每一笔订单都能准确、及时地被捕获并传输至目标系统。

二、大量数据快速写入到轻易云集成平台

面对海量数据信息，需要一种高速且稳定的大批量写入策略。我们采用了批量化操作，结合事务管理技术，使大规模的数据处理更加高效。同时，通过精细化控制分页大小和请求速率，有效应对接口调用中的分页与限流问题。这不仅提升了整体处理速度，还有效降低了因瞬间负载过高而导致的平台性能压力。

三、如何处理两端系统间的数据格式差异

不同系统通常会有不同的数据结构和存储方式，因此协调这些差异成为成功集成的重要一步。在本案中，我们实现了灵活且可扩展的数据映射规则，将用友BIP返回的复杂JSON对象解析后重新组装，以满足轻易云数据库表格模型要求。通过这种自定义映射，不同字段间可以自由匹配，大大增强了解决方案的适应性。

以上只是解决实际项目所面临挑战的一部分，在接下来的内容中，我将进一步详细介绍如何配置这些接口调用及相关技术要点，为大家带来更加全面具体的技术指导。用友与CRM系统接口开发配置

用友BIP接口调用与数据加工技术案例

在轻易云数据集成平台的生命周期管理中，调用源系统接口是数据集成的第一步。本文将深入探讨如何通过用友BIP接口/fc0dltfc/qeasy_datahub/qeasy_datahub/query_mapping_shop获取并加工数据。

接口调用配置

首先，我们需要了解如何配置和调用用友BIP接口。根据提供的元数据配置，我们使用POST方法向指定API发送请求，并传递必要的参数。

{
  "api": "/fc0dltfc/qeasy_datahub/qeasy_datahub/query_mapping_shop",
  "method": "POST",
  "number": "shop_no",
  "id": "shop_no",
  "request": [
    {
      "label": "时间戳",
      "field": "ts",
      "type": "string",
      "value": "{LAST_SYNC_TIME}0000"
    }
  ]
}

请求参数解析

在请求参数中，ts字段代表时间戳，用于标识上次同步的时间点。这个字段的值是一个字符串类型，通过占位符{LAST_SYNC_TIME}动态获取上次同步时间，并在其后追加四个零以符合接口要求。

{
  "ts": "{LAST_SYNC_TIME}0000"
}

数据请求与清洗

在发送请求后，系统会返回包含网店与客户/组织映射关系的数据。接下来，我们需要对这些数据进行清洗和预处理，以确保其质量和一致性。

数据格式验证：检查返回的数据是否符合预期的JSON格式。
字段完整性检查：确保每条记录都包含必要的字段，如shop_no。
去重处理：移除重复记录，保证数据唯一性。
异常值处理：识别并处理异常值，如空值或格式错误的数据。

示例代码：

import requests
import json

# 定义API URL和请求头
url = 'https://example.com/fc0dltfc/qeasy_datahub/qeasy_datahub/query_mapping_shop'
headers = {'Content-Type': 'application/json'}

# 构建请求体
payload = {
    'ts': '20230101000000'  # 示例时间戳
}

# 发起POST请求
response = requests.post(url, headers=headers, data=json.dumps(payload))

# 检查响应状态码
if response.status_code == 200:
    data = response.json()

    # 数据清洗过程
    cleaned_data = []
    seen_ids = set()

    for record in data:
        shop_no = record.get('shop_no')

        # 字段完整性检查
        if not shop_no:
            continue

        # 去重处理
        if shop_no in seen_ids:
            continue

        seen_ids.add(shop_no)

        # 异常值处理（示例）
        if not isinstance(shop_no, str) or len(shop_no) != expected_length:
            continue

        cleaned_data.append(record)

    print("Cleaned Data:", cleaned_data)
else:
    print("Failed to fetch data:", response.status_code)

数据转换与写入

完成数据清洗后，需要将其转换为目标系统所需的格式，并写入目标数据库或系统。这一步通常涉及以下操作：

字段映射：将源系统字段映射到目标系统字段。
数据类型转换：确保数据类型匹配，例如将字符串转换为日期类型。
批量写入：使用批量操作提高写入效率，减少网络开销。

示例代码：

# 假设目标系统需要以下字段格式
target_format = [
    {'label': '店铺编号', 'field': 'shop_id', 'type': 'string'},
    {'label': '客户编号', 'field': 'customer_id', 'type': 'string'}
]

def transform_record(record):
    return {
        'shop_id': record['shop_no'],
        'customer_id': record['customer_no']
    }

transformed_data = [transform_record(record) for record in cleaned_data]

# 批量写入目标系统（示例）
def batch_write_to_target_system(data):
    for batch in split_into_batches(data, batch_size=100):
        # 假设有一个函数write_batch负责写入操作
        write_batch(batch)

batch_write_to_target_system(transformed_data)

通过上述步骤，我们成功实现了从用友BIP接口获取、清洗、转换并写入数据的全过程。这一过程不仅提高了数据集成的效率，还确保了数据质量，为后续分析和决策提供了可靠的数据基础。打通钉钉数据接口

使用轻易云数据集成平台进行ETL转换并写入目标平台

在轻易云数据集成平台中，数据处理的第二步是将已经集成的源平台数据进行ETL（Extract, Transform, Load）转换，转为目标平台API接口所能够接收的格式，并最终写入目标平台。本文将详细探讨如何利用元数据配置，实现这一过程。

API接口配置

在本案例中，我们需要将供应商信息从源系统转换并写入目标平台。根据提供的元数据配置，目标平台API接口为wdt.purchase.provider.create，使用POST方法。以下是该API接口的字段配置：

{
  "api": "wdt.purchase.provider.create",
  "method": "POST",
  "idCheck": true,
  "request": [
    {"field": "provider_no", "label": "供应商编号", "type": "string", "describe": "代表供应商所有属性的唯一编码，用于供应商区分，ERP内支持自定义（ERP供应商界面设置），用于创建供应商数据信息", "value": "{code}"},
    {"field": "provider_name", "label": "供应商名称", "type": "string", "describe": "供应商名称", "value": "{name}"},
    {"field": "min_purchase_num", "label": "最小采购量", "type": "string", "describe": "最小采购量", "value":"1"},
    {"field": "purchase_cycle_days", "label": "采购周期", "type": "string", "describe":"采购周期","value":"1"},
    {"field":"arrive_cycle_days","label":"到货周期","type":"string","describe":"到货周期","value":"1"},
    {"field":"contact","label":"联系人","type":"string","describe":"联系人"},
    {"field":"telno","label":"座机","type":"string","describe":"座机"},
    {"field":"mobile","label":"移动电话","type":"string","describe":"手机号"},
    {"field":"fax","label":"传真","type":"string","describe":"传真"},
    {"field":"zip","label":"邮编","type":"string","describe":"邮政编码"},
    {"field":"email","label":"邮箱","type":"string","describe":"电子邮箱"},
    {"field":"qq","label":"qq","type":"string","describe":"腾讯QQ号码"},
    {"field":"wangwang","label":"旺旺号","type":"string","describe":"淘宝旺旺号"},
    {"field":"address","label":"地址","type":"string","describe":"省、市、区（县）、地址详情"},
    {"field":"website","label":"网址","type":"string","describe"："供应商官网地址"},
    {"field"："last_purchase_time"，"label"："最后采购日期"，"type"："string"，"describe"："对供应商最后一次采购日期，不传默认接口创建供应商的年月日，格式：yyyy-MM-dd HH:mm:ss"},
    {"field"："is_disabled"，"label"："停用"，"type"："string"，"describe"："是否停用"},
    {"field"："charge_cycle_days"，"label"："结算周期"，"type"："string"，"describe"："对供应商的账款结算周期，单位(天)，不传默认0"，"value"："1"}
  ]
}

数据转换过程

在ETL过程中，我们需要完成以下步骤：

提取（Extract）：从源系统提取原始数据。
转换（Transform）：根据目标API接口要求，对提取的数据进行格式和内容上的转换。
加载（Load）：将转换后的数据通过API接口写入目标系统。

以下是具体实现步骤：

提取数据

首先，从源系统提取所需的供应商信息。这一步通常涉及到数据库查询或调用源系统的API接口。

# 示例代码：从源系统提取数据
source_data = {
  'code': 'SUP123',
  'name': 'ABC Supplies',
  'contact': 'John Doe',
  'telno': '010-12345678',
  'mobile': '13800138000',
  # 更多字段...
}

转换数据

根据目标API接口要求，对提取的数据进行相应的转换。例如，将code字段映射到provider_no字段，将name字段映射到provider_name字段等。

# 示例代码：转换数据
transformed_data = {
  'provider_no': source_data['code'],
  'provider_name': source_data['name'],
  'min_purchase_num': '1',
  'purchase_cycle_days': '1',
  'arrive_cycle_days': '1',
  'contact': source_data['contact'],
  'telno': source_data['telno'],
  'mobile': source_data['mobile'],
  # 更多字段...
}

加载数据

最后，通过调用目标API接口，将转换后的数据写入目标系统。

import requests

# 示例代码：加载数据
api_url = '<轻易云集成平台API URL>'
response = requests.post(api_url, json=transformed_data)

if response.status_code == 200:
   print('Data loaded successfully')
else:
   print(f'Failed to load data: {response.text}')

注意事项

字段映射：确保所有必填字段都已正确映射，并且值符合目标API接口要求。
错误处理：在实际操作中，需要添加错误处理机制，以应对可能出现的数据质量问题或网络异常。
日志记录：建议记录每次ETL操作的日志，以便后续追踪和分析。

通过上述步骤，我们可以高效地完成从源系统到目标平台的数据ETL转换和加载过程。这不仅提高了业务流程的自动化程度，还确保了数据的一致性和准确性。用友与CRM系统接口开发配置