Легенда Unix, которая нам ничего не должна, продолжает исправлять базовый код AWK

Профессор Принстона, найдя время для себя в летнем академическом затишье, пару месяцев назад отправил электронное письмо своему старому другу. Брайан Керниган поздоровался, спросил, как проходит их визит в США, и прислал сотни строк кода , которые могли бы добавить поддержку Unicode в AWK, инструмент анализа текста, который он помог создать для Unix в Bell Labs в 1977 году.

«Я довольно много тестировал это, но явно требуется дополнительное тестирование», — написал Керниган в электронном письме, опубликованном как своего рода псевдофиксация в репозитории onetrueawk давним сопровождающим Арнольдом Роббинсом. «Как только я выясню, как… я попытаюсь отправить запрос на включение. Я хотел бы лучше понимать git, но, несмотря на вашу помощь, у меня все еще нет правильного понимания, поэтому это может занять некоторое время».

Kernighan — это «K» в AWK , языке специального назначения для извлечения и управления, который был ключом к конвейерным функциям Unix и взаимодействию между системами. Работающая awkфункция (AWK — это язык, awkкоманда для его вызова) имеет решающее значение как для стандартной спецификации UNIX, так и для сертификации IEEE POSIX с точки зрения совместимости. Существует бесчисленное множество вариантов awk, но «One True AWK», иногда известный как nawk, представляет собой версию, основанную на книге Кернигана 1985 года «Язык программирования AWK» и ее последующем вводе.

Керниган также является «K» в «K&R C», основополагающей книге 1978 года «Язык программирования C», которую он написал в соавторстве с Деннисом Ритчи, которая остается с программистами, мысленно и в потрепанной бумажной форме. Корни Си уходят намного глубже. Керниган обучал C в Bell Labs и убедил его создателя Денниса Ритчи сотрудничать в написании книги для распространения знаний. Эта книга породила «единственный истинный стиль фигурных скобок», бесконечные дебаты, сопровождающие его, и структуру, лежащую в основе каждого современного языка программирования.

Керниган также назвал Unix и первым продемонстрировал пример кода «Hello, world». Он говорил с Ричардом Дженсеном из Ars Technica о 50-летней истории Unix.

Репозиторий onetrueawk, где Керниган появился в конце мая, является относительно тихим местом: 21 участник, 46 пользователей GitHub наблюдают, а коммиты появляются каждые несколько месяцев. Как отмечает The Register , исправление Unicode Кернигана стало известно главным образом потому, что оно было упомянуто в интервью профессора на YouTube-канале Computerphile .

«Всегда смущало, что AWK работает только с ASCII или, может быть, с 8-битным вводом, но на самом деле вообще не обрабатывает Unicode», — сказал Керниган интервьюеру профессору Бейлсфорду. «Несколько месяцев назад я провел некоторое время, работая (смеется) с невероятно старой программой. Он у меня есть в тот момент, когда он фактически обрабатывает ввод и вывод UTF-8, так что вы можете иметь регулярные выражения, которые, как вы знаете, подбирают японские символы и прочее».

Керниган, которому сейчас 80 лет, мимоходом упоминает в интервью, что он также исправил кое-что «быстро и грязно», чтобы позволить AWK обрабатывать файлы CSV.

Всего в этом году в проекте Unicode 15.0 на наши устройства будет добавлен 31 новый смайлик.

В преддверии Всемирного дня эмодзи эксперты по эмодзи из Emojipedia собрали и опубликовали примеры изображений 31 нового символа эмодзи, которые планируется включить в версию 15.0 стандарта Unicode. Среди новых эмодзи, которые мы ожидаем увидеть на наших телефонах и других устройствах в конце этого года, — простое розовое сердце (наряду с серой и светло-голубой версиями), «дай пять», вибрирующее лицо, голова лося, корень имбиря, маракасы, Wi-Fi. символ, медуза и ужасный гусь .

Есть еще несколько препятствий для этих смайликов, прежде чем мы сможем начать отправлять их друг другу. Во-первых, им нужно будет довести его до финальной версии Unicode 15.0, выпуск которой в настоящее время намечен на сентябрь 2022 года. Затем разработчикам программного обеспечения нужно будет создать свои собственные рисунки для этих символов и выпустить их через обновления программного обеспечения, что обычно и происходит. через несколько месяцев после завершения спецификации Unicode.

Как отмечает Emojipedia, предлагаемый список новых смайликов примечателен своим небольшим размером — «фактически, это наименьшее количество новых смайликов, которые когда-либо рекомендовал Unicode». хотя он включает новые жесты рук, а последние несколько версий спецификации Unicode в совокупности добавили сотни новых смайликов людей. Подкомитет Emoji в последние годы настаивал на том, чтобы ограничить количество новых смайликов, включенных в любой конкретный выпуск, ссылаясь на то, как редко используются большинство символов смайликов и сколько работы требуется для таких компаний, как Apple, Microsoft, Google и Samsung. постоянно растущие списки смайликов в их программном обеспечении.

Эмодзи обычно являются наиболее комментируемым элементом любого нового стандарта Unicode, но текущая черновая версия 15.0 добавляет в общей сложности 4489 новых символов, включая те, которые необходимы для сценариев Kawi и Nag Mundari. Unicode 15.0 будет поддерживать в общей сложности 149 186 символов, включая 3664 символа эмодзи (если включены все модификаторы, в том числе для кожи, цвета волос и пола).

Всего в этом году в проекте Unicode 15.0 на наши устройства будет добавлен 31 новый смайлик.

В преддверии Всемирного дня эмодзи эксперты по эмодзи из Emojipedia собрали и опубликовали примеры изображений 31 нового символа эмодзи, которые планируется включить в версию 15.0 стандарта Unicode. Среди новых эмодзи, которые мы ожидаем увидеть на наших телефонах и других устройствах в конце этого года, — простое розовое сердце (наряду с серой и светло-голубой версиями), «дай пять», вибрирующее лицо, голова лося, корень имбиря, маракасы, Wi-Fi. символ, медуза и ужасный гусь .

Есть еще несколько препятствий для этих смайликов, прежде чем мы сможем начать отправлять их друг другу. Во-первых, им нужно будет довести его до финальной версии Unicode 15.0, выпуск которой в настоящее время намечен на сентябрь 2022 года. Затем разработчикам программного обеспечения нужно будет создать свои собственные рисунки для этих символов и выпустить их через обновления программного обеспечения, что обычно и происходит. через несколько месяцев после завершения спецификации Unicode.

Как отмечает Emojipedia, предлагаемый список новых смайликов примечателен своим небольшим размером — «фактически, это наименьшее количество новых смайликов, которые когда-либо рекомендовал Unicode». хотя он включает новые жесты рук, а последние несколько версий спецификации Unicode в совокупности добавили сотни новых смайликов людей. Подкомитет Emoji в последние годы настаивал на том, чтобы ограничить количество новых смайликов, включенных в любой конкретный выпуск, ссылаясь на то, как редко используются большинство символов смайликов и сколько работы требуется для таких компаний, как Apple, Microsoft, Google и Samsung. постоянно растущие списки смайликов в их программном обеспечении.

Эмодзи обычно являются наиболее комментируемым элементом любого нового стандарта Unicode, но текущая черновая версия 15.0 добавляет в общей сложности 4489 новых символов, включая те, которые необходимы для сценариев Kawi и Nag Mundari. Unicode 15.0 будет поддерживать в общей сложности 149 186 символов, включая 3664 символа эмодзи (если включены все модификаторы, в том числе для кожи, цвета волос и пола).

Вы знали? Вы можете нарисовать свой собственный «официальный» смайлик

Консорциум Unicode открыт до 31 июля 2022 года для новых предложений по эмодзи. Если у вас есть идеи, не стесняйтесь.

Вы когда-нибудь ловили себя на том, что пишете сообщение, прокручивая бесконечные списки смайликов только для того, чтобы понять, что смайлик, который вы сейчас ищете, не существует? Если да, или вы просто думаете, что у вас есть отличная идея для смайликов, вот ваш шанс. Консорциум Unicode, некоммерческая организация, отвечающая за индексацию эмодзи, открыт для предложений от широкой публики.

Итак, вот как представить свой собственный дизайн или идею и что означает эта запись.

Как подготовить файл

В наши дни существует множество смайликов, даже если они не появляются автоматически на вашем телефоне. Прежде чем вы начнете строить свои собственные, вам нужно сделать небольшую домашнюю работу.

Во-первых, убедитесь, что ваша идея с эмодзи еще не принята . Если нет, проверьте, что эту идею никто не предлагал и что она находится на рассмотрении . Эта страница особенно удобна, когда вы хотите отправить проект, потому что она также показывает вам, какие проекты были одобрены и отклонены, давая вам представление о том, что организация может или не может искать. Также взгляните на критерии автоматического отклонения , а также на критерии проверки .

Также найдите время, чтобы просмотреть приоритеты , руководящие принципы , стратегии , отчеты и аудиты комитета . Наконец, спросите себя, будут ли ваши смайлики часто использоваться и почему.

В видео ниже на английском языке председатель подкомитета Консорциума Unicode Дженнифер Дэниэл отвечает на ряд вопросов.

Как представить свою идею для нового смайлика

Консорциум Unicode предоставляет очень подробные инструкции , включая заполнение и отправку заявки. Убедитесь, что вы не забыли информацию в форме. Неполные файлы не будут обработаны и возвращены отправителю.

Крайний срок подачи заявок – 31 июля 2022 года.