钉钉新报销单数据集成MySQL:实践案例详解

借助轻易云，轻松实现钉钉到MySQL的自动化数据传输

2022-04-11 06:59:33
轻易云集成顾问-吕修远

钉钉数据集成到MySQL的技术案例分享：dd-新报销单（借款核销）-->mysql（鸿巢）费用报销☆

在企业日常运作中，数据的高效处理和准确集成是保证业务流畅运行的重要因素。本次我们重点探讨一个典型的系统对接集成案例，即将钉钉的新报销单数据通过轻易云数据集成平台，实时准确地写入到MySQL数据库中。这个具体方案被命名为“dd-新报销单（借款核销）-->mysql（鸿巢）费用报销☆”。

背景需求与解决方案概述

对于很多使用钉钉作为企业内部办公平台，并依赖MySQL进行财务管理的数据密集型企业来说，实现两者之间无缝的数据同步显得尤为重要。然而，由于涉及多个接口调用、分页处理以及限流控制等复杂操作，这一任务并非易事。在此背景下，我们提出了一个以高吞吐量、实时监控、高度自定义为特点的解决方案。

数据获取API调用

我们首先使用了钉钉提供的v1.0/yida/processes/instances接口，通过该API定时抓取最新生成的新报销单实例。确保每次拉取过程可靠且不漏单是至关重要的一步，为此我们设计了一套稳健的异常检测和重试机制。
数据转换与映射

由于钉钉系统中的原始数据格式可能直接无法适配目标MySQL库，因此需要进行必要的数据清洗、转换及映射。这一步利用了轻易云平台强大的自定义逻辑功能，使得整个过程中灵活性大幅提升，也帮助适应特定业务需求。
批量写入到MySQL

数据经过预处理后，被批量写入到指定的MySQL表中。这里采用的是execute API实现高效、大吞吐量的数据传输，最大程度减少延迟，同时兼顾事务一致性。
监控与告警

集成任务全流程受到集中监控，从API调用，到处理状态，再到最终写入结果，都有实时日志记录和性能跟踪。一旦出现异常，自动触发告警机制，以便及时响应和故障修复。

通过上述步骤，我们不仅确保了不同系统间的数据精准同步，还极大增强了整体工作效率，同时建立了一套鲁棒性的容错机制，以应对各类潜在问题。在文章后续部分，我们将详细解析每个技术环节及其具体实现细节，包括如何处理分页与限流问题、多线程高速写入技巧以及如何对接企业微信API接口

调用钉钉接口获取并加工数据的技术实现

在轻易云数据集成平台中，调用钉钉接口v1.0/yida/processes/instances是实现数据集成生命周期的第一步。本文将详细探讨如何通过该接口获取数据并进行初步加工，以便后续的数据转换与写入操作。

接口调用配置

首先，我们需要配置API调用的元数据。以下是关键配置项：

API路径: v1.0/yida/processes/instances
请求方法: POST
分页设置: 每页50条记录
ID检查: 启用（idCheck: true）

请求参数配置如下：

{
  "field": "pageNumber",
  "label": "分页页码",
  "type": "string",
  "describe": "分页页码",
  "value": "{PAGINATION_START_PAGE}"
},
{
  "field": "pageSize",
  "label": "分页大小",
  "type": "string",
  "describe": "分页大小",
  "value": "{PAGINATION_PAGE_SIZE}"
},
{
  "field": "appType",
  "label": "应用ID",
  "type": "string",
  "describe": "应用ID",
  "value": "APP_WTSCMZ1WOOHGIM5N28BQ"
},
{
  ...
}

这些参数确保了我们能够正确地分页获取数据，并且每次请求都能获取到最新的数据。

数据请求与清洗

在请求数据之后，我们需要对返回的数据进行清洗和初步加工。具体步骤如下：

字段重命名和格式转换：
- 将dateField_lgkieplu字段重命名为datetime_new，并转换其格式为日期类型。
- 将serialNumberField_lgk9jn2s字段重命名为order_no_new，并转换其格式为字符串类型。

{
  "formatResponse": [
    {
      "old": "dateField_lgkieplu",
      "new": "datetime_new",
      "format": "date"
    },
    {
      ...
    }
  ]
}

条件过滤：
- 确保返回的数据中，字段dateField_lgkieplu不为空。

{
  "condition": [
    [
      {
        "field": "dateField_lgkieplu",
        "logic": "notnull"
      }
    ]
  ]
}

实际案例分析

假设我们需要从钉钉系统中获取新的报销单（借款核销）数据，并将其写入MySQL数据库。以下是具体的实现步骤：

构建请求体：根据元数据配置构建请求体，确保包含必要的参数，如应用ID、用户ID、表单ID等。

{
  ...
  {
    ...
    {
      ...
      {
        ...
        {
          ...
          {
            ...
            {
              ...
              {
                ...
                {
                  ...
                  {
                    ...
                    {
                      ...
                      {
                        ...
                        {
                          ...
                          {
                            ...
                            {
                              ...
                              {
                                ...
                                {
                                  ...
                                  {
                                    ...
                                    {
                                      ...
                                      {
                                        ...
![如何开发钉钉API接口](https://pic.qeasy.cloud/S28.png~tplv-syqr462i7n-qeasy.image)
### 数据集成生命周期第二步：ETL转换与写入MySQL API接口

在数据集成的生命周期中，第二步是将已经集成的源平台数据进行ETL（提取、转换、加载）转换，并最终写入目标平台。这一步至关重要，因为它确保了数据的格式和内容符合目标系统的要求。本文将详细探讨如何通过轻易云数据集成平台，将源平台的数据转换为MySQL API接口所能接收的格式，并成功写入目标平台。

#### 元数据配置解析

在本案例中，我们需要将源平台的数据转换并写入到MySQL数据库中。以下是元数据配置：

```json
{
  "api": "execute",
  "effect": "EXECUTE",
  "method": "POST",
  "idCheck": true,
  "request": [
    {
      "field": "main_params",
      "label": "main_params",
      "type": "object",
      "describe": "111",
      "children": [
        {"field": "extend_processInstanceId", "label": "明细id", "type": "string", "value": "{bfn_id}"},
        {"field": "order_no_new", "label": "单号", "type": "string", "value":"{order_no_new}（FYBX）"},
        {"field": "datetime_new", "label": "时间", "type":"date", "value":"{datetime_new}"},
        {"field":"qty_count","label":"数量","type":"string","value":"1"},
        {"field":"sales_count","label":"金额","type":"string","value":"{{tableField_lgk9jn4p_numberField_lgk9jn43}}"},
        {"field":"status","label":"状态","type":"string"},
        {"field":"Document_Type","label":"单据类型","type":"string","value":"费用报销单"}
      ]
    }
  ],
  "otherRequest":[
    {
      "field":"main_sql",
      "label":"main_sql",
      "type":"string",
      "describe":"111",
      "value":"INSERT INTO `hc_dd_fybx` (`extend_processInstanceId`, `order_no_new`, `datetime_new`, `qty_count`, `sales_count`, `status`, `Document_Type`) VALUES (:extend_processInstanceId, :order_no_new, :datetime_new, :qty_count, :sales_count, :status, :Document_Type)"
    }
  ]
}

数据提取与转换

在这个配置中，request部分定义了从源系统提取的数据字段及其对应关系。每个字段都有明确的标签和类型说明，例如：

extend_processInstanceId 对应源系统中的 {bfn_id}。
order_no_new 对应 {order_no_new}（FYBX），表示在原有订单号后加上“FYBX”后缀。
datetime_new 对应 {datetime_new}，表示日期类型的数据。
qty_count 固定为字符串“1”。
sales_count 对应表格字段中的数值字段 {{tableField_lgk9jn4p_numberField_lgk9jn43}}。
status 和 Document_Type 分别表示状态和单据类型，其中单据类型固定为“费用报销单”。

这些字段被封装在一个名为 main_params 的对象中，以便于统一管理和处理。

数据加载

配置中的 otherRequest 部分定义了最终执行的SQL语句：

INSERT INTO `hc_dd_fybx`
(`extend_processInstanceId`, `order_no_new`, `datetime_new`, `qty_count`, `sales_count`, `status`, `Document_Type`)
VALUES (:extend_processInstanceId, :order_no_new, :datetime_new, :qty_count, :sales_count, :status, :Document_Type)

这条SQL语句将提取到的数据插入到目标MySQL数据库的表中。这里使用了命名参数（如:extend_processInstanceId），这些参数会在执行时被替换为实际值。

API接口调用

通过POST方法调用API接口，实现数据写入操作。API配置如下：

API: execute
Effect: EXECUTE
Method: POST
ID Check: true

该配置确保了每次调用API时都会检查ID，以防止重复插入或更新错误。

实际应用案例

假设我们有一条来自源系统的数据记录如下：


{

![用友与CRM系统接口开发配置](https://pic.qeasy.cloud/T20.png~tplv-syqr462i7n-qeasy.image)