ETL转化与数据写入:金蝶物料集成实践

  • 轻易云集成顾问-林峰

案例分享:金蝶云星空物料信息集成到轻易云数据集成平台

在此次技术案例中,我们聚焦于如何将金蝶云星空中的物料信息通过executeBillQuery接口集成至轻易云数据集成平台。方案名称为【仅查询】金蝶物料信息,主要实现高效、安全且可靠的数据传输和处理。

首先,需要确保从金蝶云星空提取的数据不漏单。我们将会探讨调用其API接口executeBillQuery的具体方法,包括处理分页和限流问题,以确保大规模数据获取的完整与稳定。同时也会介绍如何定时抓取这些接口数据并批量写入到轻易云平台,通过自动化调度机制保障操作的持续性和一致性。

在进行系统对接时,一项关键任务是处理两者之间的数据格式差异。这里将展示如何利用轻易云独有的定制化数据映射功能,实现无缝转换。此外,在对接过程中可能遇到异常,为此引入错误重试机制来提高整体可靠性,并结合实时监控与日志记录追踪整个数据处理过程,以便快速定位并解决问题。

最后,还要重点关注大量数据写入时的平台性能优化策略,探讨一些高效批量写入的方法,使得整个系统即使面对庞大的数据信息流,也能稳健运行。

本文开篇概要了涉及的一些核心技术点和解决思路,后续内容将详细讲解具体实现步骤及代码示例。 如何对接企业微信API接口

调用金蝶云星空接口executeBillQuery获取并加工数据

在数据集成生命周期的第一步,我们需要调用源系统的API接口以获取原始数据。本文将详细探讨如何通过轻易云数据集成平台调用金蝶云星空的executeBillQuery接口来查询物料信息,并对数据进行初步加工。

接口配置与调用

首先,我们需要了解executeBillQuery接口的基本配置和调用方式。根据元数据配置,以下是该接口的主要参数:

  • API名称: executeBillQuery
  • 请求方法: POST
  • 业务对象表单Id: BD_MATERIAL

请求参数包括:

  • FMasterId: 物料主键ID
  • FNumber: 物料编码
  • FName: 物料名称
  • FSpecification: 规格型号
  • FOldNumber: 旧物料编码
  • FDescription: 描述
  • FMaterialGroup_FNumber: 物料分组编码
  • FErpClsID: 物料属性
  • FForbidStatus: 禁用状态
  • FBaseUnitId_FNumber: 基本单位编码
  • FCreateOrgId_FNumber: 创建组织编码
  • FUseOrgId_FNumber: 使用组织编码
  • 其他字段省略

此外,还有一些用于分页和过滤的参数:

  • Limit: 最大行数,默认值为2000。
  • StartRow: 开始行索引,用于分页。
  • FilterString: 过滤条件,例如FSupplierId.FNumber = 'VEN00010' and FApproveDate>=

请求示例

以下是一个请求示例,用于查询特定条件下的物料信息:

{
    "FormId": "BD_MATERIAL",
    "FieldKeys": "FMasterId,FNumber,FName,FSpecification,FOldNumber,FDescription",
    "FilterString": "FUseOrgId.fnumber='100' and FModifyDate>='2023-01-01'",
    "Limit": "2000",
    "StartRow": "0"
}

在这个请求中,我们指定了需要查询的字段、过滤条件以及分页参数。

数据处理与清洗

获取到原始数据后,下一步是对数据进行处理和清洗。这一步骤非常关键,因为它直接影响到后续的数据转换和写入过程。

  1. 字段映射与转换 根据元数据配置中的FieldKeys,我们可以将返回的数据字段映射到目标系统所需的格式。例如,将FMasterId映射为目标系统中的主键ID,将FNumber映射为物料编码等。

  2. 数据类型转换 确保每个字段的数据类型符合目标系统的要求。例如,将字符串类型的日期转换为标准日期格式,将浮点数类型的价格字段进行四舍五入等。

  3. 数据过滤与校验 对获取的数据进行必要的校验和过滤。例如,剔除禁用状态(FForbidStatus)为禁用的物料,确保所有必填字段都有有效值等。

实际案例分析

假设我们从金蝶云星空获取了一批物料信息,并且需要将这些信息导入到另一个ERP系统中。以下是一个实际案例分析:

  1. 调用接口获取原始数据:

    {
       "FormId": "BD_MATERIAL",
       "FieldKeys": "FMasterId,FNumber,FName,FSpecification,FOldNumber,FDescription",
       "FilterString": "FUseOrgId.fnumber='100' and FModifyDate>='2023-01-01'",
       "Limit": "2000",
       "StartRow": "0"
    }
  2. 返回的数据示例:

    [
       {
           "FMasterId": "12345",
           "FNumber": "MAT001",
           "FName": "物料A",
           "FSpecification": "规格A",
           "FOldNumber": "",
           "FDescription": ""
       },
       {
           "FMasterId": "12346",
           "FNumber": "MAT002",
           "FName": "",
           ...
       }
    ]
  3. 数据清洗与处理:

    • 将空值替换为默认值或剔除无效记录。
    • 确保所有必填字段都有有效值。
    • 将日期格式统一转换为目标系统要求的格式。
  4. 最终输出结果:

    [
       {
           "id": "12345",
           "code": "MAT001",
           ...
       },
       ...
    ]

通过上述步骤,我们成功地从金蝶云星空获取并加工了所需的物料信息,为后续的数据转换和写入打下了坚实基础。 钉钉与WMS系统接口开发配置

使用轻易云数据集成平台进行ETL转换与写入

在数据集成的生命周期中,将源平台的数据进行ETL转换并写入目标平台是关键的一步。本文将详细探讨如何使用轻易云数据集成平台,将从金蝶系统查询到的物料信息进行ETL转换,最终通过API接口写入目标平台。

数据请求与清洗

首先,从金蝶系统中获取物料信息。假设我们已经完成了数据请求和初步清洗步骤,获得了符合要求的原始数据。接下来,我们需要将这些数据转换为目标平台所能接受的格式。

数据转换与写入

在轻易云数据集成平台上,数据转换通常涉及以下几个步骤:

  1. 定义元数据配置: 元数据配置是ETL过程中的重要环节,它定义了如何将源数据映射到目标平台的数据结构中。在本案例中,我们使用如下元数据配置:

    {
       "api": "写入空操作",
       "effect": "EXECUTE",
       "method": "POST",
       "idCheck": true
    }

    该配置指定了API接口的调用方式及其相关参数。

  2. 数据格式转换: 根据目标平台API接口的要求,对源数据进行格式化。例如,如果源数据包含如下字段:

    {
       "material_id": "12345",
       "material_name": "钢材",
       "quantity": 100,
       "unit": "kg"
    }

    我们需要将其转换为目标平台所需的格式。假设目标平台要求的数据格式如下:

    {
       "id": "12345",
       "name": "钢材",
       "qty": 100,
       "unit_of_measurement": "kg"
    }
  3. 调用API接口: 使用轻易云提供的API接口,将转换后的数据写入目标平台。具体实现可以通过编写脚本或使用轻易云提供的可视化工具完成。以下是一个示例脚本,展示如何通过HTTP POST请求将数据发送到目标平台:

    import requests
    import json
    
    url = 'https://api.qingyiyun.com/execute'
    
    headers = {
       'Content-Type': 'application/json'
    }
    
    data = {
       'id': '12345',
       'name': '钢材',
       'qty': 100,
       'unit_of_measurement': 'kg'
    }
    
    response = requests.post(url, headers=headers, data=json.dumps(data))
    
    if response.status_code == 200:
       print("Data written successfully")
    else:
       print(f"Failed to write data: {response.status_code}")
  4. 处理响应与错误: 在实际操作中,需要处理API响应和可能出现的错误。例如,如果API返回错误代码或异常信息,需要根据具体情况进行相应处理,以确保数据能够正确写入。

实践中的注意事项

  • ID校验:元数据配置中的idCheck参数设置为true,意味着在写入操作前会对ID进行校验。这一步骤确保不会重复或错误地插入已有的数据。
  • 异步处理:轻易云支持全异步操作,可以提高大批量数据处理的效率。在实现过程中,可以利用异步机制来优化性能。
  • 实时监控:利用轻易云的数据流动和处理状态监控功能,可以实时跟踪每一步操作,及时发现和解决问题。

通过上述步骤,我们可以高效地将从金蝶系统获取的物料信息进行ETL转换,并通过轻易云提供的API接口写入到目标平台。这不仅简化了复杂的数据集成过程,还提升了业务流程的透明度和效率。 打通用友BIP数据接口