从编辑器到输入法

本贴最后更新于 1029 天前,其中的信息可能已经事过景迁

从 Markdown 到 TeX,一直到现在接触另一门语言。感觉我的技术栈一直围绕着文本编辑和处理,谈谈自己的心路历程吧~这不完全是一篇技术贴。

大学毕业的“无业游民”

2021 年的 7 月份,我从物理系应用物理学专业毕业了。没有选择找工作,也没有考研,4 月份看到“大学生志愿服务西部计划”的报名就申请来了。我来到了新疆维吾尔自治区昌吉回族自治州木垒哈萨克自治县的一个边境乡镇,今天是南方的小年,没有假期、过年也回不了家了,来疆快半年了。

造不完的轮子,填不完的坑

Anthony Fu关于 Yak Shaving 一文我深有感触,我从不缺少去写有趣、有价值代码的机会,但是时常感叹光阴易逝、时间太少。关注我 GitHub 的人知道我这个人尤其喜欢“挖坑”,只是很可惜自己很难有时间全部写完。

说说我的近况吧,最近写的一些项目技术含量可以说很一般了,主要是在做“贡献”。

因为自己在一个哈萨克自治县做志愿者,语言自然成为了第一大考验,即使年轻人都还是会说汉语的。我惊奇的发现拥有数百万人口的哈萨克族竟然没有一个好用的 PC 输入法,键入哈萨克语的过程很复杂,加上哈萨克语的独特性等等,让我萌生了为哈萨克语写输入法的想法。

简述哈萨克语挖坑

在国内,哈萨克语使用阿拉伯-波斯字母(下面简称老文字),而在哈萨克斯坦更多的是西里尔字母,还有没有完全拉丁化、奇奇怪怪的拉丁化方案。国内哈萨克语总共有 33 个字母,而西里尔哈萨克语有 42 个字母。国内哈萨克语里有大量汉语词,西里尔哈萨克语却显得格外的“俄里俄气”。此外,国内老文字的哈萨克语布局遵循 RTL,游标的问题还是蛮麻烦的。

哈语比较菜,就写两句打个招呼吧。(顺便测了一下,发现 Vditor 的光标处理似乎也有问题)

سالىم

جاقسى

填坑哈语输入法

一开始想自己基于 IME 框架实现输入法的,但是需要花费很多精力,然后就看到了熟悉的 Rime。

Rime,作为 Linux 数年玩家的我来说,是满熟悉的。作为一个输入法而言,它最大的特点莫过于可以自己写输入方案了。研究了个把小时的官方文档,并结合了 Rime 的案例,以及大量的参考文档。最终自己基于 Rime 实现了哈拼输入方案,已经基于 GPL v3 协议开源。

HerbertHe/hapin-arabic: Rime Hapin Input Schema رايم حاپين ەنگيزۋ سقەماسى (github.com)

不是技术的总结

哈拼更多的精力并不是如何技术实现哈萨克语输入法,而是自己结合音标和其它资料进行产品设计。

哈拼仍然是一项语言实验,并且会持续向消除语音标识歧义消除的方向改进。希望从编辑器、编译器,到输入方案的开发可以使更多人从中受益吧。

  • 总结
    205 引用 • 1748 回帖 • 2 关注
  • 2021
    7 引用 • 17 回帖
1 操作
HerbertHe 在 2022-01-28 01:13:33 更新了该帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...