如何通过ETL将钉钉数据写入MySQL数据库

  • 轻易云集成顾问-杨嫦
### 钉钉数据集成到MySQL:案例分享 在企业级应用中,如何高效地将业务系统中的关键信息集成到数据库,是一个普遍且重要的问题。特别是对于需要实时处理和分析海量数据的场景,采用适合的平台和方法尤为关键。本次我们将介绍一个具体的案例:通过轻易云数据集成平台,将钉钉备用金申请单的数据无缝对接到MySQL数据库,实现从原始数据抓取、转换、写入到实时监控的全链条操作。 #### 案例背景概述 本案例涉及的是如何将钉钉系统中的备用金申请单(API接口: `topapi/processinstance/get`)批量、高效且可靠地集成到MySQL中的BI崛起-备用金申请表。目的是为了使得后续的数据分析工作更加便捷,并确保所有的重要信息都能被及时记录和处理。 #### 数据获取与分页处理 首先,需要解决的是从钉钉获取大量历史数据,并定时完整地抓取新增数据。由于API接口存在分页限制,我们必须设计合理的分页策略以确保不会漏掉任何一条记录。同时,为了应对限流问题,也需实现自动重试机制,以保证在网络波动或服务异常情况下任务依然可重复并最终成功完成。 #### 数据格式转换与写入 另一项技术挑战是在于两套系统之间的数据格式差异。例如,所请求的JSON字段可能需要经过复杂的数据映射逻辑才能适配MySQL目标表结构。这就要求我们使用强大的自定义数据转换功能,通过灵活配置来满足各种特定需求。此外,由于会有大量的数据批量写入需求,高吞吐量能力也是平台选择的重要依据。 #### 实时监控与告警机制 为了保证整个过程中各个环节运行顺利,我们还设置了集中化的监控和告警系统,对每一次任务执行情况进行实时跟踪。一旦发现异常,不但可以立即通知相关人员,还能够通过日志详细定位问题原因,从而快速修复并恢复正常运行。 以上概述了几个主要技术点,但这只是开端。在之后章节中,将详细讲解上述各步骤以及更多细节,包括实际代码示例及配置方式等。 ![金蝶与SCM系统接口开发配置](https://pic.qeasy.cloud/D8.png~tplv-syqr462i7n-qeasy.image) ### 调用钉钉接口topapi/processinstance/get获取并加工数据 在轻易云数据集成平台中,调用钉钉接口`topapi/processinstance/get`是实现数据集成生命周期的第一步。本文将详细探讨如何通过该接口获取钉钉中的备用金申请单数据,并进行初步加工,为后续的数据转换与写入做好准备。 #### 接口配置与调用 首先,我们需要根据元数据配置来设置API调用参数。以下是元数据配置的详细内容: ```json { "api": "topapi/processinstance/get", "effect": "QUERY", "method": "POST", "number": "number", "id": "id", "idCheck": true, "request": [ { "field": "process_code", "label": "审批流的唯一码", "type": "string", "describe": "这里填写钉钉表单的id", "value": "PROC-78BAC6BE-8AC5-4569-B67E-E72275F88312" }, { "field": "start_time", "label": "审批实例开始时间。Unix时间戳,单位毫秒。", "type": "string", "describe": "Help", "value": "_function {LAST_SYNC_TIME}*1000" }, { "field": "end_time", "label": "审批实例结束时间,Unix时间戳,单位毫秒", "type": "string", "describe": "Help", "value": "_function {CURRENT_TIME}*1000" }, { "field": "size", "label": "分页参数,每页大小,最多传20。", "type": "string", "describe": "", 'value': '20' }, { 'field': 'cursor', 'label': '分页查询的游标,最开始传0,后续传返回参数中的next_cursor值。', 'type': 'string', 'describe': '' } ], 'autoFillResponse': true } ``` #### 参数解析与设置 1. **process_code**: 用于指定要查询的审批流类型,这里填写的是备用金申请单的唯一标识码。 2. **start_time**: 审批实例开始时间,以Unix时间戳表示。使用函数`_function {LAST_SYNC_TIME}*1000`动态生成。 3. **end_time**: 审批实例结束时间,同样以Unix时间戳表示。使用函数`_function {CURRENT_TIME}*1000`动态生成。 4. **size**: 每页返回的数据条数,最多为20条。 5. **cursor**: 分页查询游标,初始值为0,后续请求中使用返回结果中的`next_cursor`值。 这些参数确保了我们能够精准地获取到所需的审批实例数据,并且支持分页查询以处理大量数据。 #### 数据请求与清洗 在完成API调用配置后,我们可以通过轻易云平台发起POST请求,从钉钉系统中获取备用金申请单的数据。以下是一个示例请求体: ```json { 'process_code': 'PROC-78BAC6BE-8AC5-4569-B67E-E72275F88312', 'start_time': '_function {LAST_SYNC_TIME}*1000', 'end_time': '_function {CURRENT_TIME}*1000', 'size': '20', 'cursor': '0' } ``` 响应结果将包含多个字段,包括审批实例ID、发起人、状态等信息。为了便于后续处理,我们需要对这些原始数据进行初步清洗和格式化。例如,将Unix时间戳转换为可读日期格式,将多层嵌套的数据结构展平等。 #### 数据转换与写入准备 经过清洗后的数据,需要进一步转换为目标系统(如BI崛起)的格式。这一步通常包括字段映射、类型转换等操作。例如,将钉钉中的审批实例ID映射到BI崛起系统中的对应字段。 在轻易云平台中,可以通过可视化界面或脚本编写来完成这些转换操作,并最终将处理好的数据写入目标系统。 #### 实时监控与调试 在整个过程中,轻易云平台提供了实时监控功能,可以随时查看数据流动和处理状态。如果出现错误或异常,可以通过日志和调试工具快速定位问题并解决。 通过以上步骤,我们成功地实现了从钉钉系统获取备用金申请单数据并进行初步加工,为后续的数据集成奠定了基础。这一过程充分利用了轻易云平台的强大功能,使得复杂的数据集成任务变得简单高效。 ![钉钉与MES系统接口开发配置](https://pic.qeasy.cloud/S18.png~tplv-syqr462i7n-qeasy.image) ### 数据集成生命周期第二步:ETL转换与写入MySQL API接口 在数据集成的生命周期中,ETL(Extract, Transform, Load)转换是关键步骤之一。本文将详细探讨如何将已经集成的源平台数据通过轻易云数据集成平台转换为目标平台MySQL API接口所能接收的格式,并最终写入目标平台。 #### 元数据配置解析 在进行ETL转换之前,我们需要了解元数据配置。以下是一个典型的元数据配置示例: ```json { "api": "execute", "effect": "EXECUTE", "method": "POST", "idCheck": true, "request": [ { "field": "main_params", "label": "main_params", "type": "object", "describe": "111", "children": [ {"field": "bfn_id", "label": "id", "type": "string", "value":"{id}"}, {"field": "department", "label":"部门", "type":"string", "value":"{{部门}}"}, {"field":"purpose_details","label":"用途内容-费用明细","type":"string","value":"{{用途内容-费用明细}}"}, {"field":"corresponding_subjects","label":"对应科目","type":"string","value":"{{对应科目}}"}, {"field":"borrowing_date","label":"借款日期","type":"string","value":"{{借款日期}}"}, {"field":"borrowing_amount","label":"借款金额(元)","type":"string","value":"{{借款金额(元)}}"}, {"field":"repayment_date","label":"还款日期","type":"string","value":"{{还款日期}}"}, {"field":"responsible_person","label":"负责人","type":"string","value":"{{负责人}}"}, {"field":"receipt_method","label":"收款方式","type":"string","value":"{{收款方式}}"}, {"field":"other_receipt_account","label":"其他收款账号","type":"string","value":"{{其他收款账号}}"}, {"field":"payee_name","label":"收款户名","type":"string","value":"{{收款户名}}"}, {"field":"receipt_account","label":"收款账号","type":"string","value" :"{{收款账号}}"}, {"field" :"receipt_bank" ,"label" :"收款银行" ,"type" :"string" ,"value" :"{{收款银行}}"}, {"field" :"borrowing_purpose" ,"label" :"借款用途" ,"type" :"string" ,"value" :"{{借款用途}}"}, {"field" :"financial_payment_method" ,"label" :"财务支付方式" ,"type" :"string" ,"value" :"{{财务支付方式}}"}, {"field" :"actual_payment_amount" ,"label" :"实付金额(元)" ,"type" :"string" ,"value ":"{{实付金额(元)}}"}, {"field ":"create_time ","label ":"审批发起时间 ","type ":"string ","value ":"{{extend.create_time }}"}, {"field ":"finish_time ","label ":"审批结束时间 ","type ":"string ","value ":"{{extend.finish_time }}"}, {"field ":"originator_userid ","label ":"发起人userid ","type ":"string ","value ":"{{extend.originator_userid }}"}, {"field ":"originator_dept_id ","label ":"发起人所属部门id ","type ":"string ","value ":"{{extend.originator_dept_id }}"}, {"field ":status," label ":审批实例状态," type ": string," value ": {{extend.status}}}, { field: result, label: 审批结果, type: string, value: {{extend.result}}}, { field: business_id, label: 审批编号, type: string, value: {{extend.business_id}}}, { field: originator_dept_name, label: 发起人所属部门名称, type: string, value: {{extend.originator_dept_name}}}, { field: biz_action, label: 审批实例业务动作, type: string, value: {{extend.biz_action}}} ] } ], otherRequest:[ { field:"main_sql", label:"main_sql", type:"string", describe:"111", value:"REPLACE INTO emergency_fund_application (bfn_id,department,purpose_details,corresponding_subjects,borrowing_date,borrowing_amount,repayment_date,responsible_person,receipt_method,other_receipt_account,payee_name,receipt_account,receipt_bank,borrowing_purpose,financial_payment_method,actual_payment_amount ,create_time ,finish_time ,originator_userid ,originator_dept_id ,status ,result ,business_id ,originator_dept_name ,biz_action) VALUES (:bfn_id,:department,:purpose_details,:corresponding_subjects,:borrowing_date,:borrowing_amount,:repayment_date,:responsible_person,:receipt_method,:other_receipt_account,:payee_name,:receipt_account,:receipt_bank,:borrowing_purpose,:financial_payment_method,:actual_payment_amount,:create_time , :finish_time , :originator_userid , :originator_dept_id , :status , :result , :business_id , :originator_dept_name , :biz_action);" } ] } ``` #### 数据请求与清洗 在ETL过程的第一步,数据请求与清洗阶段,我们从源系统中提取原始数据。这些原始数据可能包含冗余信息或不符合目标系统要求的数据格式。在这一阶段,我们需要对这些数据进行清洗和标准化处理,以确保其符合目标系统的输入要求。 例如,从钉钉获取备用金申请单的数据时,我们可能会得到如下结构的数据: ```json { "id": 12345, "部门": "市场部", ... } ``` #### 数据转换 在数据转换阶段,我们根据元数据配置,将清洗后的源数据映射到目标系统所需的数据结构中。根据上面的元数据配置示例,字段映射关系如下: - `bfn_id` 对应 `{id}` - `department` 对应 `{{部门}}` - `purpose_details` 对应 `{{用途内容-费用明细}}` - ... 通过这种映射关系,我们可以将源系统中的字段值转换为目标系统所需的格式。例如: ```json { bfn_id: '12345', department: '市场部', purpose_details: '市场推广费用', ... } ``` #### 数据写入 最后,在数据写入阶段,我们使用SQL语句将转换后的数据写入到MySQL数据库中。根据元数据配置中的`main_sql`字段,可以看到我们需要执行以下SQL语句: ```sql REPLACE INTO emergency_fund_application (bfn_id, department,purpose_details,...) VALUES (:bfn_id,:department,:purpose_details,...); ``` 在实际操作中,通过API调用将上述SQL语句发送到MySQL服务器进行执行,从而完成数据的写入。 #### 示例代码 以下是一个示例代码片段,展示了如何使用Python实现上述ETL过程: ```python import requests import json # 定义API URL和头信息 api_url = 'http://your-api-url/execute' headers = {'Content-Type': 'application/json'} # 定义请求体 data = { 'main_params': { 'bfn_id': '12345', 'department': '市场部', ... }, 'main_sql': """ REPLACE INTO emergency_fund_application (bfn_id, department,purpose_details,...) VALUES (:bfn_id,:department,:purpose_details,...); """ } # 将请求体转为JSON格式 payload = json.dumps(data) # 发起POST请求 response = requests.post(api_url, headers=headers, data=payload) # 检查响应状态码 if response.status_code == 200: print('Data written successfully') else: print('Failed to write data:', response.text) ``` 以上代码展示了如何通过HTTP POST请求将转换后的数据写入MySQL数据库。实际应用中,可以根据具体需求对代码进行调整和优化。 通过上述步骤,我们可以高效地完成从源平台到目标平台的数据ETL转换与写入,实现不同系统间的数据无缝对接。 ![如何对接金蝶云星空API接口](https://pic.qeasy.cloud/T7.png~tplv-syqr462i7n-qeasy.image)