“计算机于中文处理”技术职业水准技能入门级培训细节公示目录逐月更新

 寰球关注地球暖化及人类智能问题的华夏子孙们:

    从本月开始,我们将用一年的时间在场内公示“‘计算机于中英文处理’技术职业水准技能入门培训”的具体细节。我们曾经在免费公众版文稿中透露了不少细节,比如有纯文本处理Ⓐ、含文字信息的图像处理Ⓑ及图文提取Ⓒ等三个主要技术领域。并且我们也规定了,接受培训的职场人士并非IT业从业人员,也就是说,该培训应该是你离开高等学校(含各种业余大学)后,首次有机会从程序员的角度学习并努力掌握“计算机于中英文处理”技术的很多细节,同时极大程度地提升自己的语言应用能力。在这样一种基本设定下,我们认为,用户首先花费约一年的时间,初步熟悉该技术同普通意义上的IT技术的区别¹,同时认真考察自己所从事行业的语言应用情况,为自己规定一个约十年的培训规划是绝对必要的。
    现在已经是2024年度的年初了,在去年的大半年内,本活动对相当长时间内具体内容保持高度可信的现代汉语资料作了初步整理,大致完成了具体专业大类针对性不明显的一些语言技能练习准备工作。敬请注意同期公布的一些相关文稿。
    关于“……入门培训”的收费,目前的规定是$500美元。因为目前我们仍然接受正版VCD(DVD)碟片折价支付²,如果您手头或亲友处有一些正版VCD或DVD碟片,千万注意这个重大优惠。

    2024年4月继续公开部分:
    特别注意,以下内容均建立在以“民营书屋”为途径所提供的个性化会员服务基础之上。
        ➊汉字构件分析;
        ➋制备机读(字|词)典;
        ➌普通分词技术;
        ➍带专业倾向(高级)分词技术;
        ➎如何在涉及“繁|简”表达方面避免……
        ➏非唯一分词可能情形的恰当处理方法
        ➐专业类主题词索引生成
        ➑……¹⁰
    以下内容是已经公开部分的标题:
      Ⓐ纯文本处理基础内容:
    ➀纯文本文件格式详介❶(标准化过程及ANSI、何谓源代码)
    ➁纯文本文件格式详介❷(纯文本文件的基本操作、字符串及其他)
    ➂纯文本文件格式详介❸(UNICODE详介,及对应的国标GB和大五码Big5)
    ➃符号(基本类别之外,再按行业、专业分类)(数理、财经、交通……)
    ➄汉字部首之“计算机于中文处理”技术应用
    ➅汉字注音符号之“计算机于中文处理”技术应用
    ➆中华文化特有字符³集
      Ⓐ纯文本处理(“承上启下”⁴)部分:
        ➇Text Processing aid by Computer(s)基石范例及对“计算机于中文处理”的启示
      Ⓐ纯文本处理内容:
        ➈针对GB、Big5编码标准抑或Unicode(统一码)国际标准的文字处理技术分析
        ➉“批处理”操作中的“检索”(‘之’应用范例)
        ⑪专业类“符号”处理(纯文本处理领域)
        ⑫汉字构件(纯文本处理领域)
        ⑬汉字排序方式方法
        ⑭机读‘字|词’典制备初步
        ⑮实体书(报)刊章节电子化
        ⑯(文字段)语句电子化
        ⑰常见输入法无法输入汉字的备选输入技术入门
        ⑱Unicode繁简字表详析
        ⑲正排序及逆排序词表生成
        ⑳标点符号及相关中英文处理问题辨析
      Ⓐ纯文本处理(专业级“承上启下”⁴)部分:
        ㉑以“民营书屋”为途径所提供的个性化会员服务

      Ⓑ图像处理基础内容:
        ➀点阵图初步
        ➁各种常见图形文件格式简介
        ➂图像的抽象化vs矢量化
        ➃矢量图初步(“增智健体”位矢图基本概念)
        ➄色度学初步
        ➅图像处理高级项目概述
        ➆(Opt)绘画工具书应用(上、中、下)(仅对接受过高等教育相关专业训练者开放)
        ➇电子照相术vs传统摄影术(从IT业角度重新认识暗房技术的点点滴滴)
      Ⓑ图像处理(“承上启下”⁴)部分:
        ➈CPU vs GPU
        ➉从工笔到水墨(技法)
        ⑪致摄影爱好者(操作者亲手操作下的电子化源图后期处理)
      Ⓑ图像处理内容:
        ⑫初级点阵图→矢量图
        ⑬中级点阵图→矢量图(三个层次,或者说需要循序渐进逐步完成)
        ⑭高级点阵图→矢量图(具体细节待定,或者说,视具体进展而定)
        ⑮按行业、项目分类的矢量图→点阵图(初级、中级)
        ⑯中国画特征分析初步
        ⑰中国画线描点阵图与矢量表述的关联
        ⑱中国画(国画)着色方式方法与(写景)水墨画着彩方式方法的对照
        ⑲源自电子相机原创照片的后期处理
      Ⓑ图像处理(专业级“承上启下”⁴)部分:
        ⑳“静态”局限下的图像处理专业某些研究生级别课程内容


      Ⓒ图文提取基础内容:
        ➀(Opt)光学字符识别Optical Character Recognition(OCR)技术简介⁵
        ➁为什么说“单字符分色显示”是华夏文明下一个脉动节点?
        ➂字形标准(并非字体标准)
        ➃黑底白字的标准RLE处理
        ➄灰度点阵图向标准RLE字图的转换
        ➅彩图中单色字域的逐一处理
        ➆独立(目标)字符组的增减处理(如同时加入数字组和英文字母时“0oO”⁶识别复杂度)
      Ⓒ图文提取(“承上启下”⁴)部分:
        ➇汉字字形二维构建分布(layout)及OCR技术史简要
        ➈构成有意义文字识别基础的字符集构建(应用对象局限于小型工具书)
      Ⓒ图文提取内容:
        ➉同一批次图像之图文自动分离
        ⑪同一批次图像各种印刷字体文字区域的自动标记
        ⑫(连环画类别语料)文字框的自动标记(表格、线描图文字框等延伸服务受源文本制约⁷)
        ⑬偶发性特殊字符(如无法打印的特殊汉字、特意彩印的极少数字符等)的预处理
        ⑭英文大写字母识别
        ⑮英文小写字母识别
        ⑯英文易混淆字形处理
        ⑰(英文识别)杂有斜体、加重等字形时的处理⁸
        ⑱中文最常见字符识别⁹
      Ⓒ图像处理(专业级“承上启下”⁴)部分:
    ⑲暂以“屈才”定名的图文格式化输出

    其它内容待续……

    最后,从本年度开始,我们在努力争取“一个中国、两岸三地”执业律所通过“增智健体”横向联系服务为我们代理收取“计算机于中英文处理”技术服务付费的同时,每个月将为前200位不知道我们具体联系方式的网友个人提供免费的“首次入场细节”电话咨询。敬请注意:与我们建立联系的电子邮箱是Material398@yahoo.com。

⁰“增智健体”活动相关培训内容的“静态”局限将帮助学员更好地理解“动态”成像过程所固化的平面信息所带来的“处理”技术广阔应用前景。
¹经过多年准备,我们须提醒读者,IT业的程序员所完成的代码,通常意义上并非为自己而准备的。或者说,软件被整合到对应硬件上,作为一个整体由用户使用。“……入门培训”的“计算机于中英文处理”技术技能是用户作为个人所掌握的技能,所进行的“文字处理”工作(自己参与编定的代码本身绝无必要同时转移)当然可以移植到工作场所去,而所积累的职场经验及久经考验的文字处理代码连同更为重要之编程体验则可望成为“信息时代”的传家宝。
²每张DVD折价$5元;每张VCD折价$1元。寄送前必须从我们这里得到没有重复且仍然需要该正版语料的正式确认。
³具体种类相当多,初始阶段不可能面面俱到,有意接受培训者所以必须参与意见反馈。
⁴“承上启下”部分的具体内容限有意参与培训者及已经完成相关付费者免费索取,且每个年度每人只能索取一份。
⁵非收费项目,也就是说,仅仅是技术介绍,属于赠送培训内容。
⁶统一码为中文‘零’的字符表示准备了○。
⁷本活动在技术细节上也必须认真考虑知识产权保护的相关规定。也就是说,如果源文本早已电子化,而操作者只是针对印刷物再次进行电子化,本活动不准备在技术上实现合理支持,与此相关的一个重要技术实施细节敬请用户届时向我们问询。
⁸因为具体字符识别部分主要围绕中文字形的形态特征制备,所以识别过程对加重、斜体不敏感。
⁹纯文本处理部分所支持的字符处理已经远超8万字(其中很多字在字义上其实已经重复了,比如‘法’(灋㳒)),为在实际操作中帮助接受培训者同时在图文电子化的‘质’及‘量’尽快达到最佳状态,所以本活动考虑根据实际印刷字体(字形复杂度)及文字内容(内容年代)在尽可能覆盖字形上完备的构件集的情况下,指导用户按5~7个分集自行完成中文字符识别的内容。
¹⁰对于“计算机于中文处理”技术而言,语料完成最简单完美(无谬误而已,千万注意现代汉语之前,中文经历了至少两千多年的纯文字无标点断句连续使用历史)标注是最接近于Text Processing aid by Computer(s)基石范例的语义处理出发点,同时也是本入门级语言处理技能培训对于高级文科人才有决定性意义的“正式起点”。


谢谢您的阅读


Comments

Popular posts from this blog

《国父实录》相关活动正版影视剧碟片“‘材’征召”2022年度更新

“计算机于中文处理”技术职业水准技能入门级培训具体细节更新的通知

2024年度起以场内免费“‘材’征召”辅导服务的更新