news 2026/6/23 5:25:09

【Java + Elasticsearch全量 增量同步实战】

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【Java + Elasticsearch全量 增量同步实战】

Java + Elasticsearch 全量 & 增量同步实战:打造高性能合同搜索系统

在企业合同管理系统中,我们常常遇到以下挑战:

  • 合同量大,文本内容多,传统数据库查询慢

  • 搜索需求多样:全文搜索、按签署人筛选、分页排序

  • 历史合同也要可搜索,不仅仅是新建合同

  • 统计报表需求:合同签署量、签署人分析等

本文将分享如何使用Elasticsearch + MySQL + ClickHouse构建一个高性能合同搜索系统,并提供完整 Java 示例。


一、系统架构概览

合同系统采用“三角架构”:

┌───────────────────────┐ │ 前端 / API │ │ (创建 / 修改 / 查询) │ └─────────┬─────────────┘ │ ▼ ┌───────────────────────┐ │ MySQL 数据库 │ │ (权威业务数据源) │ └─────────┬─────────────┘ │ ┌──────────────┴───────────────┐ │ │ 【历史数据全量初始化】 【增量同步 / 实时更新】 │ │ ▼ ▼ 分页 / 批量读取历史合同 新建合同 / 修改合同 / 删除合同 │ │ ▼ ▼ 转换为 ContractDoc 转换为 ContractDoc │ │ ▼ ▼ ES Bulk API ES Index / Update / Delete API │ │ └───────────┬──────────────────┘ ▼ ┌───────────────┐ │ Elasticsearch │ │ contract │ │ index │ └───────────────┘ │ ▼ ┌───────────────┐ │ 查询接口 │ │(合同列表 / 搜索)│ └───────────────┘

核心说明

  • MySQL:权威数据源,存储所有合同业务信息

  • ES:用于搜索,支持全文搜索、筛选和排序

  • ClickHouse:用于统计报表,处理大规模合同分析


二、为什么使用宽表

1. 什么是宽表?

宽表 = 把多张业务表的数据提前合并到一张字段很多的表里,用“空间换时间”,减少查询时的 join。

传统 MySQL 查询可能涉及多个 join,性能差:

SELECT c.*, u.name, e.enterprise_name FROM contract c JOIN user u ON c.user_id = u.id JOIN enterprise e ON c.enterprise_id = e.id WHERE c.status = 'SIGNED';

宽表设计后,所有信息在一条记录中:

{ "contractId": 10001, "contractTitle": "劳动合同", "contractStatus": "SIGNED", "signTime": "2025-12-01 10:30:00", "initiatorId": 2001, "initiatorName": "张三", "initiatorPhone": "138****", "enterpriseId": 3001, "enterpriseName": "天津数字认证有限公司", "fileHash": "xxxx", "signType": "SILENT", "source": "OPEN_API" }
  • 查询无需 join,ES 或 ClickHouse 查询极快

  • 冗余换来性能,是搜索系统的设计常态


三、ES 全量初始化历史数据

1. Java 代码示例(全量导入)

@Service public class ContractEsService { @Autowired private ContractMapper contractMapper; @Autowired private RestHighLevelClient esClient; /** * 全量初始化合同数据到 Elasticsearch */ public void initHistoricalContracts() throws IOException { int pageSize = 500; int page = 0; while (true) { List<Contract> contracts = contractMapper.selectHistorical(page * pageSize, pageSize); if (contracts.isEmpty()) break; BulkRequest bulkRequest = new BulkRequest(); for (Contract contract : contracts) { ContractDoc doc = toContractDoc(contract); bulkRequest.add(new IndexRequest("contract_index") .id(String.valueOf(doc.getContractId())) .source(doc.toMap())); } esClient.bulk(bulkRequest, RequestOptions.DEFAULT); page++; } } private ContractDoc toContractDoc(Contract contract) { ContractDoc doc = new ContractDoc(); doc.setContractId(contract.getId()); doc.setContractTitle(contract.getTitle()); doc.setContractStatus(contract.getStatus()); doc.setSignTime(contract.getSignTime()); doc.setInitiatorId(contract.getUserId()); doc.setInitiatorName(contract.getUserName()); doc.setInitiatorPhone(contract.getUserPhone()); doc.setEnterpriseId(contract.getEnterpriseId()); doc.setEnterpriseName(contract.getEnterpriseName()); doc.setFileHash(contract.getFileHash()); doc.setSignType(contract.getSignType()); doc.setSource(contract.getSource()); return doc; } }

说明

  • 分批读取,避免内存爆炸

  • BulkRequest提高写入性能

  • ContractDoc为宽表结构,支持全文搜索


四、增量同步

1. 新建合同

public void saveContract(Contract contract) throws IOException { contractMapper.insert(contract); // 写 MySQL ContractDoc doc = toContractDoc(contract); esClient.index(new IndexRequest("contract_index") .id(String.valueOf(doc.getContractId())) .source(doc.toMap()), RequestOptions.DEFAULT); // 写 ES }

2. 更新合同

public void updateContract(Contract contract) throws IOException { contractMapper.update(contract); ContractDoc doc = toContractDoc(contract); esClient.update(new UpdateRequest("contract_index", String.valueOf(doc.getContractId())) .doc(doc.toMap()), RequestOptions.DEFAULT); }

3. 删除合同

public void deleteContract(Long contractId) throws IOException { contractMapper.delete(contractId); esClient.delete(new DeleteRequest("contract_index", String.valueOf(contractId)), RequestOptions.DEFAULT); }

五、查询示例

public List<ContractDoc> searchContracts(String keyword, String status) throws IOException { SearchRequest searchRequest = new SearchRequest("contract_index"); SearchSourceBuilder sourceBuilder = new SearchSourceBuilder(); BoolQueryBuilder boolQuery = QueryBuilders.boolQuery(); if (keyword != null) { boolQuery.must(QueryBuilders.multiMatchQuery(keyword, "contractTitle", "enterpriseName")); } if (status != null) { boolQuery.filter(QueryBuilders.termQuery("contractStatus", status)); } sourceBuilder.query(boolQuery).from(0).size(20); searchRequest.source(sourceBuilder); SearchResponse response = esClient.search(searchRequest, RequestOptions.DEFAULT); List<ContractDoc> results = new ArrayList<>(); for (SearchHit hit : response.getHits()) { results.add(ContractDoc.fromMap(hit.getSourceAsMap())); } return results; }
  • 支持全文搜索和条件过滤

  • 支持分页

  • 支持宽表字段查询(无需 join)


六、增量 & 历史数据同步策略总结

数据类型处理方式
历史合同全量初始化→ 批量写入 ES
新建合同实时写入 ES
更新合同实时更新 ES
删除合同实时删除 ES

建议

  • 增量同步可结合消息队列 + CDC,保证最终一致性

  • 历史数据初始化建议在低峰时执行,分批写入


七、总结

  1. 宽表 + ES:提高合同搜索性能,避免 join

  2. 全量初始化历史数据:ES 支持既往合同搜索

  3. 增量同步:保证新数据实时可查

  4. 三角架构(MySQL + ES + ClickHouse):各司其职

    • MySQL:权威数据

    • ES:快速搜索

    • ClickHouse:报表分析【聚合极快、适合统计数据量(亿级)报表】

通过这套设计,合同系统既能秒级响应搜索,又能提供高效报表分析,满足大规模企业业务需求。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/19 17:23:50

科研数据探索新维度:NSFC项目智能分析系统深度体验

科研数据探索新维度&#xff1a;NSFC项目智能分析系统深度体验 【免费下载链接】nsfc 国家自然科学基金查询 项目地址: https://gitcode.com/gh_mirrors/nsf/nsfc 当科研工作者面对海量的国家自然科学基金数据时&#xff0c;如何快速获取有效信息成为了一道难题。今天&a…

作者头像 李华
网站建设 2026/6/18 11:25:58

7、利用CardSpace和Windows Communication Foundation开发软件+服务

利用CardSpace和Windows Communication Foundation开发软件+服务 在软件开发领域,软件与服务的结合正成为一种趋势。Windows Communication Foundation(WCF)和Windows CardSpace这两项技术为实现软件+服务的开发提供了强大的支持。下面将详细介绍这两项技术以及如何使用它们…

作者头像 李华
网站建设 2026/6/23 16:07:18

Scada-LTS开源项目完整使用指南:从零开始构建工业监控系统

Scada-LTS开源项目完整使用指南&#xff1a;从零开始构建工业监控系统 【免费下载链接】Scada-LTS Scada-LTS is an Open Source, web-based, multi-platform solution for building your own SCADA (Supervisory Control and Data Acquisition) system. 项目地址: https://g…

作者头像 李华
网站建设 2026/6/21 10:21:12

Godot-MCP革命:用AI对话创造你的梦想游戏世界

Godot-MCP革命&#xff1a;用AI对话创造你的梦想游戏世界 【免费下载链接】Godot-MCP An MCP for Godot that lets you create and edit games in the Godot game engine with tools like Claude 项目地址: https://gitcode.com/gh_mirrors/god/Godot-MCP &#x1f3ae;…

作者头像 李华
网站建设 2026/6/23 17:16:06

大明开国勋臣的三重贡献:李善长、胡惟庸与蓝玉的历史功绩再审视

大明开国勋臣的三重贡献&#xff1a;李善长、胡惟庸与蓝玉的历史功绩再审视引言&#xff1a;开国群英谱中的复杂身影在中国历代王朝的开国史上&#xff0c;明朝的建立无疑是一部充满传奇色彩与剧烈冲突的史诗。朱元璋从一介布衣跃升为九五之尊&#xff0c;其过程既得益于个人的…

作者头像 李华