Какой самый дорогой китайский иероглиф в современном Китае?

искусственный интеллект NLP

самые дорогие китайские иероглифы

«Вы сказали, какой самый дорогой китайский иероглиф в современном Китае?» — спросил меня однажды коллега.

«[Нуо], потому что обещание стоит тысячи долларов», — выпалил я.

"неправильный."

«[Word], одно слово стоит тысячи долларов?»

Коллеги покачали головами.

"Любовь?"

«Это бесценно, бессчетно».

"Талант. Разве не говорят, что самое дорогое в 21 веке - это талант?"

— Одно слово, ты не в счет. Почему бы тебе не сказать, что домашние письма стоят десять тысяч золотых?

«Забудь, давай не будем гадать» Я покрутил в уме несколько слов, но ни одно из них не совпало.

Я подозрительно посмотрел на него и сдался.

疑惑

«Ответ — демонтировать».

"демонтировать?"

«Да. Снос, снос снос».

После разговора коллега улыбнулся. В улыбке три части мира, шесть частей хитрости и одна часть запустения.

«Разрушение, богатство. Когда оно будет разрушено, останется богатство».

Однако я был сбит с толку: «Так, этот снос имеет какое-то отношение к вам? Или ко мне?»

«Это все связано, — сделал паузу коллега, — ни одно из них».

«При чем тут мы, мы снесли хозяйский дом и путешествовали по миру?»

«Нет, давай сегодня снесем что-нибудь другое. Только не дом».

«Если дом не снести, то что?»

«Разбери слова».

"Характер?"

«Да. Слова, китайские иероглифы».

разделить слово

«Кандзи, ты знаешь?» — продолжил коллега.

"Чушь. Проблема, известная ученикам начальной школы".

«Знаете ли вы три элемента китайских иероглифов?»

«Звук и смысл».

«Знаете ли вы, как использовать программу для реализации суждения о двух похожих персонажах?»

«Вы не обратили внимания на Лао Ма, он всего два дня назад написал алгоритм реализации формы НЛП рядом со словами».

«Я читал этот алгоритм, он так себе. Некоторые сцены не подходят».

"Например?"

«Например, [Ming] и [冐] имеют разную структуру и разные радикалы. Но похожи ли они?»

竟能如此相像

Реальная культура ограничила мое воображение, и после 0,9 секунды шока я тут же опроверг.

"Легко сказать, как вы можете решить эту проблему?"

Коллега улыбнулся: «Это не сложно. Это включает в себя главного героя сегодняшнего дня, разделяющего персонажей».

"О. Я хотел бы услышать об этом."

«Мы можем разбить самые основные компоненты китайских иероглифов. Например, [Мин] можно разделить на [День], [Месяц] и [冐] похоже. Затем мы сравниваем, одинаковы ли все части, и используем их. вычислить сходство».

«Это очень хорошо, — я не мог не кивнуть в похвале, — тогда вопрос в том, сколько времени потребуется, чтобы такой процесс разделения символов был реализован?»

Коллега улыбнулся: «Из-за бездарности я за два выходных дня написал программу для разделения слов».

«Сю, ты уничтожишь Цинь Ши Миньюэ Хан Шигуань, а я посмотрю».

Коллега стучит маленькой рукой, и результат выводится手乀禾日寸日月冂一一水又日寸丷天.

«Да, да. Какая польза от вашей программы, кроме околословных слов в форме НЛП?»

«Есть много применений, но самое главное — быть красивым. Например, эта картинка автоматически сгенерирована мной с помощью разделенных слов и изображений облаков».

拆分与云图

Технологии всегда будут устаревшими, но быть красивым — это дело всей жизни.

«Вы знаете, из какого предложения состоит эта картинка? Позвольте мне дать вам подсказку. Оно происходит от слова».

Лигатура

Думая о проблеме, заданной моими коллегами, у меня в последнее время проблемы со сном днем ​​и ночью, как мне это решить?

Как говорится, общая тенденция мира, долгосрочное единство должно быть разделено, долгосрочное разделение должно быть объединено.

Поскольку китайские иероглифы можно разделить, можно ли их объединить?

Так что на написание программы для слияния китайских иероглифов ушло два дня.

можно поставить手乀禾日寸日月冂一一水又日寸丷天слился в秦时明月汉时关.

Коллегам было интересно.

«Как вы этого добились, интересно».

«Это не сложно, просто измените логику разделения китайских иероглифов».

«Например, когда солнце и луна сливаются, как вы решаете, Мин это или Янь?»

«Я сделал статистику частоты слов, и приоритет отдается частоте слов одного китайского иероглифа. Конечно, иногда это не подходит. Лучше комбинировать метод n-грамм для повышения контекстуальной точности».

«Хорошо. А как насчет алгоритма сопоставления?»

«Алгоритм FAST-Forward похож на предыдущие конфиденциальные слова с открытым исходным кодом».

— Да, да. Итак, ты разгадал тайну, которую я тебе дал?

话里画外

не разбирать

"Удачи, разблокировал."

"Как ты сделал это?"

«Вечером я нашла «Поэзию Цюань Сун», но подумала, что ваше название должно быть широко используемой «Поэзией», поэтому первый шаг сузил сферу применения.

"Тогда что?"

«Я объединил радикалы в вашей картинке и исчерпал китайские иероглифы. Затем я провел поиск. После того, как я нашел это, я разделил содержимое и сравнил его. К счастью, я его нашел».

«Идея хорошая. Вы обнаружили, что разделение также хорошо для кодов подтверждения?»

«Да, стоимость этой идентификации относительно высока по сравнению с риском машинного обучения традиционной капчи».

«Разбиение слов также полезно для интеграции в игры по расшифровке. Как и в случае с «Играми в слова», нанять вас для технических исследований и разработок — не проблема».

Коллега улыбнулся и вздохнул: «В последнее время я думаю, что иногда не все должно быть полезным. Технологии всегда будут устаревшими, а культура имеет длинную историю. Будь то снос или деньги, хорошо иметь их, и не имеет значения, если у вас его нет».

Какое-то время я не знал, что сказать, но когда вчера вечером посмотрел на загадку, раскрытую программой, там была строка слов.

怒发冲冠,凭栏处、潇潇雨歇。抬望眼,仰天长啸,壮怀激烈。三十功名尘与土,八千里路云和月。

让子弹飞