news 2026/1/30 23:49:47

ES 新手入门:10分钟搞定项目集成与基础使用

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
ES 新手入门:10分钟搞定项目集成与基础使用
    • 第一步:本地起一个 ES
    • 第二步:Java 项目引入依赖
    • 第三步:定义一个实体类
    • 第四步:写个 Repository
    • 第五步:试试写入和查询
    • 遇到的问题 & 小技巧
    • 最后说两句

最近我们团队开始在新项目里用 Elasticsearch(简称 ES),主要是为了做订单和用户的模糊搜索。以前用数据库 LIKE 查询,慢得要死,特别是数据量一大,用户搜个名字都卡半天。后来老大说:“试试 ES 吧,搞不好真香。” 我就硬着头皮上手了,结果发现——真的没那么难

这篇文章就是我踩坑后整理的“人话版”入门指南,不讲原理,只讲怎么快速跑起来。目标是:10 分钟内,让你的 Java 项目能往 ES 里写数据、也能查出来


第一步:本地起一个 ES

别一上来就想着集群、分片、副本。先本地跑起来再说。

我用的是 Docker,一行命令搞定:

docker run -d --name es -p9200:9200 -p9300:9300 -e"discovery.type=single-node"docker.elastic.co/elasticsearch/elasticsearch:8.12.0

注意:ES 8 默认开启安全认证,对新手不太友好。如果你只是本地测试,可以加个环境变量关掉:

-e"xpack.security.enabled=false"

跑起来后,浏览器访问http://localhost:9200,看到一堆 JSON 信息,说明 OK 了。


第二步:Java 项目引入依赖

我们用的是 Spring Boot,所以直接加 starter:

<dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-elasticsearch</artifactId></dependency>

然后在application.yml里配一下地址:

spring:elasticsearch:uris:http://localhost:9200

如果你关了安全认证,这样就行。如果开了,还得配用户名密码,但新手建议先关掉,省事。


第三步:定义一个实体类

假设我们要存“用户”信息,比如 ID、姓名、手机号、邮箱。

@Document(indexName="user")publicclassUser{@IdprivateStringid;privateStringname;privateStringphone;privateStringemail;// getter / setter 省略}

这里关键就两行:

  • @Document(indexName = "user"):告诉 ES,这个类对应 ES 里的user索引(你可以理解成“表”)。
  • @Id:主键,ES 会用它做文档 ID。

我们的经验是:字段名尽量用英文小写,别用下划线,避免映射出问题。


第四步:写个 Repository

Spring Data 给我们提供了超简单的操作方式:

publicinterfaceUserRepositoryextendsElasticsearchRepository<User,String>{// 按名字模糊搜List<User>findByNameContaining(Stringname);}

就这一行!继承ElasticsearchRepository,泛型填你的实体类和 ID 类型,CRUD 方法都有了。

那个findByNameContaining是 Spring Data 的命名规则,意思是“名字包含 xxx”。ES 会自动转成全文检索,不用写查询语句。


第五步:试试写入和查询

写个测试方法:

@SpringBootTestclassEsTest{@AutowiredprivateUserRepositoryuserRepository;@TestvoidsaveUser(){Useruser=newUser();user.setId("1");user.setName("张三");user.setPhone("13800138000");user.setEmail("zhangsan@example.com");userRepository.save(user);}@TestvoidsearchUser(){List<User>users=userRepository.findByNameContaining("张");users.forEach(System.out::println);}}

先跑saveUser(),再跑searchUser(),控制台应该能打出“张三”。

我认为:这比写 SQL 简单多了,尤其是模糊匹配,数据库要加%还可能走不到索引,ES 天然支持。


遇到的问题 & 小技巧

  1. 索引没自动创建?
    Spring Data 默认会在第一次 save 时自动建索引。但如果字段类型复杂(比如嵌套对象),可能需要手动建 mapping。新手先用简单字段,基本没问题。

  2. 中文搜不准?
    默认的分词器对中文不友好。比如搜“张三”,可能拆成“张”和“三”,但如果你搜“张三丰”,可能就匹配不上。
    我们的做法是:先用默认的跑通流程,等业务稳定了再单独处理中文分词(比如集成 ik 分词器)。别一上来就想完美,容易劝退。

  3. ID 到底用啥?
    我们一般用业务主键(比如用户 ID 字符串),而不是让 ES 自动生成。这样方便和数据库对齐。


最后说两句

ES 确实强大,但新手最容易犯的错就是“想一口吃成胖子”——又是调分片,又是搞高亮,又是聚合分析……结果连最基础的增删改查都没跑通。

在我看来,先让它跑起来,能用就行。等真遇到性能问题或功能瓶颈,再深入优化。大部分中小项目,用默认配置 + 简单查询,已经能解决 90% 的搜索需求了。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/22 14:04:22

Kotaemon能否用于保险条款解读?复杂文本简化能力

Kotaemon能否用于保险条款解读&#xff1f;复杂文本简化能力 在保险行业&#xff0c;一份标准的重疾险合同动辄上百页&#xff0c;密布着“等待期”“免责情形”“给付条件”等专业术语。当用户问出“甲状腺癌还能赔吗&#xff1f;”这样看似简单的问题时&#xff0c;背后可能涉…

作者头像 李华
网站建设 2026/1/24 3:28:41

23、跨平台 Unix 系统管理与自动化工具实践

跨平台 Unix 系统管理与自动化工具实践 在管理多样化的 *nix 机器基础设施时,可以结合使用 SSH 密钥、NFS 挂载的源目录和跨平台 Python 代码,以下是详细步骤。 系统管理步骤 创建 SSH 公钥 :在用于管理机器的系统上创建 SSH 公钥。不同平台的操作可能有所不同,可参考操…

作者头像 李华
网站建设 2026/1/29 22:49:53

30、Python 并发编程:线程、进程与调度全解析

Python 并发编程:线程、进程与调度全解析 1. 线程的使用 在 Python 中,线程是实现并发的一种方式。下面通过几个具体的例子来详细介绍线程的应用。 1.1 多线程 ARPing 以下代码展示了如何使用多线程进行 ARPing 操作: worker.start() #spawn pool of arping threads f…

作者头像 李华
网站建设 2026/1/28 9:12:16

rt-linux下的“硬实时”的hrtimer通知机制

一、背景 之前的一些rt-linux的博客已经讲到,由于rt-linux下注册的hrtimer的回调默认都并非在硬中断里直接执行,而是被放到的软中断里去执行,这会导致一些实时性的问题,甚至一些系统基础的操作如常见的一些用户态定时睡眠的一些操作在rt-linux下变得有些波动。另外,有些抓…

作者头像 李华
网站建设 2026/1/22 6:40:17

60、C 编程综合知识解析

C# 编程综合知识解析 1. 并发类与集合 在 C# 编程中, System.Collections.Concurrent 命名空间提供了一系列并发类,这些类在多线程环境下能高效地处理数据集合。主要的并发类包括: - ConcurrentQueue<T> :实现了先进先出(FIFO)的队列,可在多线程环境下安全地…

作者头像 李华
网站建设 2026/1/30 13:31:42

3、矩阵、狄拉克符号与经典及量子计算基础

矩阵、狄拉克符号与经典及量子计算基础 1 方阵相关性质 方阵具有多种重要性质,基于这些性质可定义出在经济学和金融领域有广泛应用的特殊方阵。假设 (A) 是一个 (NN) 的可逆复值方阵,与之相关的矩阵如下: |矩阵类型|符号|分量规则|示例(以 (A = \begin{pmatrix}1 & …

作者头像 李华