news 2026/1/22 6:17:02

中文分词模拟器

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
中文分词模拟器

题目描述

给定一个连续不包含空格字符的字符串,该字符串仅包含英文小写字母及英文标点符号(逗号、句号、分号),同时给定词库,对该字符串进行精确分词。

说明:

  • 精确分词:字符串分词后,不会出现重叠。例如 "ilovechina",不同切分后可得到 "i", "love", "china"。

  • 标点符号不分词,仅用于断句。

  • 词库:根据常识及词库统计出来的常用词汇。例如:dictionary={"i","love","china","ilovechina","lovechina"}。

  • 分词原则:采用分词顺序优先且最长匹配原则。“ilovechina”,假设分词结果[i,ilove,lo,love,ch,china,lovechina] 则输出 [ilove,china]

    • 错误输出:[i, lovechina],原因:"ilove" > 优先于 "lovechina" 成词。

    • 错误输出:[i, love, china],原因:"ilove" > "i",遵循最长匹配原则。

输入描述

  1. 字符串长度限制:0 < length < 256
  2. 词库长度限制:0 < length < 100000
  3. 第一行输入待分词语句 "ilovechina"
  4. 第二行输入中文词库 "i, love, china, ch, na, ve, lo, this, is, the, word"

输出描述

按顺序输出分词结果 "i, love, china"

示例一

输入:
ilovechina
i,love,china,ch,na,ve,lo,this,is,the,word

输出:
i,love,china

说明:
输入的字符串被按最长匹配原则分为 "i", "love", "china"。

示例二

输入:
ilovech
i,love,china,ch,na,ve,lo,this,is,the,word

输出:
i,love,ch

说明:
输入的字符串被按最长匹配原则分为 "i", "love", "ch"。

示例三

输入:

iat
i,love,china,ch,na,ve,lo,this,is,the,word,beauti,tiful,ful
输出:

i a,t

代码思路

2024华为OD机试真题---中文分词模拟器-CSDN博客

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/20 1:09:24

Skyhigh Security升级数据安全态势管理(DSPM)能力,助力企业满足《数字个人数据保护法》(DPDPA)合规要求,强化亚太地区数据保护

功能升级方案应对复杂隐私与监管需求 数据优先型安全服务边缘(SSE)领域的领导者Skyhigh Security今日宣布&#xff0c;在旗下Skyhigh DSPM产品的Data Explorer中推出一款具备可执行性、智能化且聚焦风险的数据可视性与合规仪表板 。2025年4月&#xff0c;数据安全态势管理(DSP…

作者头像 李华
网站建设 2026/1/17 18:43:42

Wan2.2-T2V-A14B与Stable Video Diffusion对比:谁更适合商用?

Wan2.2-T2V-A14B与Stable Video Diffusion对比&#xff1a;谁更适合商用&#xff1f; 在AI生成内容&#xff08;AIGC&#xff09;浪潮席卷全球的今天&#xff0c;文本到视频&#xff08;Text-to-Video, T2V&#xff09;技术正从实验室走向生产线。广告、教育、电商、影视等行业…

作者头像 李华
网站建设 2026/1/18 7:51:54

如何用AU处理音乐详细的元数据Metadata-程序员·原创音乐人·卓伊凡

如何用AU处理音乐详细的元数据Metadata-程序员原创音乐人卓伊凡元数据&#xff08;Metadata&#xff09;里所有 AI 相关信息怎么删、怎么改音频本身通过 AU 做一些“人味处理”&#xff0c;尽量减少 AI 痕迹&#x1f9e9; 一、核心目标先说明白用 AU 能做的主要是两类事情&…

作者头像 李华