• Welcome to Български Националистически Форумъ.
 
avatar_Hatshepsut

Програма за традиционенъ български правописъ, съ разширена кирилица

Започната отъ Hatshepsut, 06 Авг 2023, 15:14:10

0 Потрѣбители и 1 гостъ преглеждат тази тема.

HatshepsutTopic starter

В Download-секцията е качена нова версия на програмата 2.6
Промените са следните:

1. Към двете клавиатурни подредби е добавена буквата L l (Alt+7) "средноевропейско Л" (звук, който се среща в някои български диалекти)
2. Символът на английската лира £ е с променена позиция Alt+Shift+5

Информацията и скрийншотите в първия постинг на темата са обновени.

HatshepsutTopic starter

По-нагоре в темата бе спомената книгата на Стойко Стойков "Българска диалектология". Тя обаче е от 1962г. и в някои отношения е остаряла. Наскоро прочетох книгата на Мирослав Михайлов "Фонетика на съвременния български книжовен език", където забелязах някои новости в българските диалекти, настъпили в последните години. Имам предвид навлизането на нови звукове, досега незастъпени в българските диалекти, става дума за звуците Ö и Ü, които вече се срещат в някои български диалекти в югоизточна България. Авторът споменава, че тези звукове са навлезли под влияние на турския език. Цитирам дословно:

«...в югоизточните български говори, под влиянието на турския език се срещат и гласните [ö] и [ÿ], най-често в
заемки от турски, но не само. Така на практика в българския език турската заемка гьол се изговаря по три начина: [г'òл], [гйòл], [гöл].»

За тези два звука в клавиатурните подредби на програмата са предвидени буквите Є є (за Ö) и Ү ү (за Ü)
Shocked Shocked x 1 View List

HatshepsutTopic starter

По повод последните версии на програмата се налага да актуализирам и детайлизирам моята лична гледна точка относно разширената версия на кирилицата.
Според мен би трябвало да има три "варианта" на кирилицата:

• стандартен набор (това са добре познатите 30 букви от нашата азбука, от А до Я)

• традиционен набор. Освен стандартния набор от 30 букви, плюс още 6 букви:

- старобългарски гласни звуци
Ѣ ѣ
Ѫ ѫ
Ѭ ѭ
Ѵ ѵ

- африкати
S ѕ (дз)
Џ џ (дж)

• разширен набор. Освен гореизброените 30+6 букви на стандартния и традиционния набор, още и следните 22 букви:

- глайдове
Ў ў (ԝ) "късо У", като в wind

- старобългарски гласни звуци
Ы ы

- преходни гласни звуци
Э э (æ) "широко Е", между А и Е, като в hand
Ө ө "широко О", между О и А, като в rock
Є є (ö), между О и Е, като в schӧn
Ү ү (ü), между У и И, като в für
Ә ә "широко Ъ", между Ъ и А, като в sun

- придихателни съгласни звуци
Ҩ ҩ (th), като в three
Þ þ (ð), като в then
Ҧ ҧ (ph)
Ӄ ӄ (kh)
Ҫ ҫ (чх)
Ҙ ҙ (цх)

- Х варианти
Ҕ ҕ (gh) звучно Х
Һ һ (һ) ларингално Х
Ӽ ӽ (χ) фарингално Х

- Р/Л варианти
Ҏ ҏ (rh)
Ԓ ԓ твърдо Л
L l средноевропейско Л

- билабиални съгласни звуци
F f (φ) билабиално Ф
Ԝ ԝ (β) билабиално В

- носови съгласни звуци
Ӈ ӈ (ng), като в king

Като цяло, разширеният набор включва общо 58 букви  :nerd:

HatshepsutTopic starter

Кодова таблица на клавиатурните подредби

Реших да добавя и кодовата таблица на допълнителните букви в двете клавиатурни подредби, не само за сведение, а и това да бъде в помощ на потребителите с операционни системи, различни от Windows, примерно Linux  :nerd:

Започвам с малко теоретично пояснение от Уикипедия, става дума за стандарта за кодиране Уникод:

Уникод (на английски: Unicode) е стандарт в компютърната индустрия за кодиране, представяне и обработка на текст на повечето писмености в света. Той е разработен да реши проблемите, причинявани от едновременната употреба на голям брой несъвместими помежду си традиционни кодировки за различните езици. Стандартът се поддържа от Консорциума Уникод и през 2018 г. най-новата му версия 11.0 съдържа 137 439 знака и обхваща 146 писмености на съвременни и мъртви езици, както и много символи (например от математиката и инженерните дисциплини) и емоджита. Знаковият набор на Уникод е синхронизиран със стандарта ISO/IEC 10646 и кодовете в двата стандарта са еднакви.

Стандартът Уникод се състои от комплект справочни таблици за кодовете, метод за кодиране и набор от стандартни знакови кодировки, комплект от еталонни файлове с данни, както и някои документи, свързани с изброените, например относно свойствата на знаците, правилата за нормализация, декомпозиция, визуализиране и ред на изписване на двупосочен текст (за правилно показване на текст със смесени посоки на изписване: от дясно наляво, като при арабски и иврит, и от ляво надясно).

Успехът на Уникод в обединяването на знаковите набори е довел до широкото му използване и доминиращо положение в интернационализацията и локализацията на компютърен софтуер. Стандартът се използва в множество съвременни технологии, включително съвременните операционни системи, XML, езици за програмиране и .NET Framework.

Уникод може да се прилага чрез различни кодировки. Стандартът дефинира UTF-8, UTF-16, UTF-32, а в употреба са и още няколко начина за кодиране. Най-често използваните кодировки са UTF-8, UTF-16 и UCS-2, предшественик на UTF-16.

При UTF-8, използвана в над 90% от уебсайтовете, за първите 128 кода се използва по един байт, а за останалите – до 4 байта. Първите 128 кода от Уникод съвпадат с тези на ASCII, което означава, че всеки текст в ASCII е и в UTF-8.

При UCS-2 за всеки знак се използват два байта (16 бита), но така могат да се представят само първите 65 536 кода, които образуват групата Basic Multilingual Plane (BMP, Основна многоезична група). Тъй като са възможни общо 1 114 112 кода в 17 различни групи, а вече са дефинирани над 137 000 от тях, много от знаците в Уникод са извън обхвата на UCS-2. Затова тя се смята за остаряла, макар да е все още в широка употреба. UTF-16 разширява UCS-2, като използва същото 16-битово кодиране за BMP и 4-байтово – за останалите групи. Всеки текст в UCS-2, който не съдържа кодове в запазения диапазон U+D800–U+DFFF, представлява и валиден текст в UTF-16.

При UTF-32 (наричана още UCS-4) за всеки знак се използват 4 байта. Както и при UCS-2, броят байтове на знак е фиксиран, което улеснява индексирането им в паметта, но за разлика от UCS-2, с UTF-32 могат да се представят всички кодове в Уникод. Поради кодирането на всеки знак с четири байта обаче UTF-32 заема много повече памет от другите кодировки и не се използва широко.

https://bg.wikipedia.org/wiki/Уникод


Ето и самата кодова таблица...

Всеки код започва с U+, последван от 4 шестнадесетични цифри. Само за първата буква ще изпиша U+, за да не натоварвам списъка излишно.
Малките букви са отляво, а главните - отдясно.

ѣ U+0463   Ѣ  U+0462
ѫ  046b    Ѫ  046a
ѭ  046d    Ѭ  046c
ѕ  0455    S  0405
џ  045f    Џ  040f
э  044d    Э  042d
ҕ  0495    Ҕ  0494
ӄ  04c4    Ӄ  04c3
ӈ  04c8    Ӈ  04c7
ҧ  04a7    Ҧ  04a6
ҩ  04a9    Ҩ  04a8
þ  00fe    Þ  00de
ў  045e    Ў  040e
є  0454    Є  0404
ү  04af    Ү  04ae
ә  04d9    Ә  04d8
һ  04bb    Һ  04ba
ы  044b    Ы  042b
ѵ  0475    Ѵ  0474
ҏ  048f    Ҏ  048e
ԓ  0513    Ԓ  0512
ө  04e9    Ө  04e8
ӽ  04fd    Ӽ  04fc
f  0066    F  0046
l  006c    L  004c
ԝ  051d    Ԝ  051c
æ  00e6    Æ  00c6
ѧ  0467    Ѧ  0466
ҫ  04ab    Ҫ  04aa
ҙ  0499    Ҙ  0498

ѝ  045d    Ѝ  040d
à  00e0    À  00c0
è  00e8    È  00c8
ò  00f2    Ò  00d2
ỳ  1ef3

HatshepsutTopic starter

В Download-секцията е качена нова версия на програмата 2.7
Промените са следните:

1. Към фонетичната клавиатурна подредба е добавено "долно тире" _ (Alt+1)
2. Към двете клавиатурни подредби е добавенo "многоточие" …
В клавиатурната подредба БДС този символ се набира с Alt+=, а във фонетичната с Alt+2
3. Символът на английската лира £ във фонетичната клавиатурна подредба е с променена позиция Alt+Shift+4
4. Към двете клавиатурни подредби е добавен знак за промил ‰
В клавиатурната подредба БДС този символ се набира с Alt+Shift+3, а във фонетичната с Alt+Shift+5

Информацията и скрийншотите в първия постинг на темата са обновени.

HatshepsutTopic starter

В Download-секцията е качена нова версия на програмата 2.8

Добавена е нова клавиатурна подредба layout03 - традиционна фонетична подредба (стандартът до 2006г.)

Информацията и скрийншотите в първите постинги на темата са обновени.

HatshepsutTopic starter

Заемки от латиницата в клавиатурните подредби

В трите клавиатурни подредби има няколко букви, които са заети от латиницата:

Æ æ
Þ þ
F f
L l

Æ æ представя едноименния звук, средно произношение между гласните А и Е. За същия звук в клавиатурните подредби е предвидена като алтернатива кирилската буква Э э

Þ þ представя звука (ð), произношението е като в английската дума then

F f представя звука "билабиално Ф"

L l представя звука "средноевропейско Л"

Като изключим збука Æ, за останалите три звука няма налични кирилски букви като алтернатива, затова се принудих да заема съответните букви от латиницата. Освен това, специално за звука "средноевропейско Л" в българската диалектология се използва същата буква L

Може да ви направи впечатление, че в клавиатурните подредби има още една латинска буква - Ԝ ԝ, но това е всъщност буква от кирилицата, която се изписва графично по същия начин  :judge:


Както и да е, на този етап не виждам алтернатива на тези заемки от латиницата, ако някой има предложения по въпроса, нека ги представи в темата  :smile-1:

Panzerfaust

Æ æ е лигатура и е основно характерна за германските народи. За среден звук между А и Е определено е най-добрата графема. Э може да предизвика объркване.
Þ þ дори не бих нарекъл напълно латинска буква, защото идва от древногерманските руни. И тя е перфектна за звука си.

HatshepsutTopic starter

В Download-секцията е качена нова версия на програмата 2.9

Промените са следните:

1. Към клавиатурната подредба БДС е добавено "средно тире" – Alt+2
2. Към трите клавиатурни подредби са добавени цифри 2 и 3 в горен индекс: ² (Alt+Shift+2) и ³ (Alt+Shift+3)
3. Към трите клавиатурни подредби са добавени горни десни кавички ” (Alt+Shift+")

Информацията и скрийншотите в първите постинги на темата са обновени.


Цифрите ² и ³ могат да бъдат полезни, когато се набира текст, в който има квадратни и/или кубични стойности, примерно "квадратен километър" км² или "кубичен сантиметър" см³

С добавянето на десните двойни кавички използващите програмата вече могат да цитират и маркират текст по всичките 4 различни начини:

"текст" – обикновени кавички
„текст“ – "български" кавички (всъщност това е немския стандарт)  :aha:
«текст» – кавички според френския стандарт
“текст” – кавички според английския стандарт

HatshepsutTopic starter

В Download-секцията е качена нова версия на програмата 3.0

Промените са следните:

1. Към клавиатурната подредба БДС е добавено "маймунско А" @ (Alt+2)
2. Средното тире – при клавиатурната подредба БДС е с променена позиция Alt+1

Информацията и скрийншотите в първия постинг на темата са обновени.

На този етап в трите клавиатурни подредби има свободни „клавиш и половина“ – този израз означава един клавиш плюс горния регистър на другия клавиш :)
Значи може да се добави още една буква и един символ, не повече.

HatshepsutTopic starter

В Download-секцията е качена нова версия на програмата 3.1

Промените са следните:

Някои от буквите в трите клавиатурни подредби са разместени, а други са с променени фонетични стойности:

1. Буквата Æ е с ново местоположение Alt+A
2. Буквата Є е с ново местоположение Alt+~
3. Буквата Ө е с ново местоположение Alt+О
1. Буквата À е с ново местоположение Alt+;

Буквата Э вече обозначава звука [ö] (средно произношение между О и Е)
Буквата Є вече обозначава звука "тясно Е" (средно произношение между Е и И). Този звук се среща в някои източни български диалекти, това е т.нар. меко произношение :)

HatshepsutTopic starter

Ето и актуалната структура на моята гледна точка за разширената кирилица.
Според мен, като автор на програмата, би трябвало да има три "варианта" на кирилицата:

• стандартен набор (това са добре познатите 30 букви от нашата азбука, от А до Я)

• традиционен набор. Освен стандартния набор от 30 букви, плюс още 6 букви:

- старобългарски гласни звуци
Ѣ ѣ
Ѫ ѫ
Ѭ ѭ
Ѵ ѵ

- африкати
S ѕ (дз)
Џ џ (дж)

• разширен набор. Освен гореизброените 30+6 букви на стандартния и традиционния набор, още и следните 24 букви:

- глайдове
Ў ў (ԝ) "късо У", като в wind

- старобългарски гласни звуци
Ы ы
Ѧ ѧ

- преходни гласни звуци
Æ æ (æ) "широко Е", между А и Е, като в hand
Ө ө "широко О", между О и А, като в rock
Э э (ö), между О и Е, като в schӧn
Ү ү (ü), между У и И, като в für
Ә ә "широко Ъ", между Ъ и А, като в sun
Є є "тясно Е", между Е и И

- придихателни съгласни звуци
Ҩ ҩ (th), като в three
Þ þ (ð), като в then
Ҧ ҧ (ph)
Ӄ ӄ (kh)
Ҫ ҫ (чх)
Ҙ ҙ (цх)

- Х варианти
Ҕ ҕ (gh) звучно Х
Һ һ (һ) ларингално Х
Ӽ ӽ (χ) фарингално Х

- Р/Л варианти
Ҏ ҏ (rh)
Ԓ ԓ твърдо Л
L l средноевропейско Л

- билабиални съгласни звуци
F f (φ) билабиално Ф
Ԝ ԝ (β) билабиално В

- носови съгласни звуци
Ӈ ӈ (ng), като в king

Като цяло, разширеният набор включва общо 60 букви :)

HatshepsutTopic starter

Относно гласните букви с двоеточие отгоре (диерезис)

В гръцката азбука, както и в някои варианти на латиницата и кирилицата има гласни звуци, които се изписват с две точки отгоре (диерезис). Тези две точки като диакритичен знак обозначават разлика в произношението спрямо гласния звук, изписван без диакритични знаци.

В гръцката азбука

В гръцката азбука двете точки се използват при двугласни и обозначават разделното произношение на двата гласни звука, примерно двугласната οι се прознася като Е, а οϊ се произнася ОИ

В латиницата

Най-известните примери са в германската азбука ä, ö, ü
Двете точки над гласните звуци в случая указват различно (преходно) произношение:

ä е звук междинен между А и Е
ö е звук междинен между О и Е
ü е звук междинен между У и И

Същите букви се използват по аналогичен начин и в други латински азбуки: турска, финландска, естонска и др.

В кирилицата

Най-известни примери в кирилицата са руската буква ё, обозначаваща звука ЙО и украинската буква ї, обозначаваща звука ЙИ

Има и други подобни кирилски букви, които са по-малко известни и за които произношението им не ми е ясно  :rolleyes:

Примерно това са буквите ӧ, ӱ, ӹ, ӫ, ӛ и ӭ  :nerd:

Интересно е да се отбележи, че буквата Ӭ се е използвала, макар и рядко, в руския дореформен правопис за обозначаването на френското eu и немското ö. Радетел за въвеждането ѝ в руския език е академик Яков Грот. И въпреки че се появява епизодично в руския дореволюционен печат, буквата Ӭ така и не бива въведена официално.


След този доста обширен увод идва ред на същината на въпроса: понеже в българската кирилица досега не са се използвали такива букви, считам за ненужно да добавям подобни букви с двоеточие към клавиатурните подредби на програмата, която обсъждаме в тази тема  :judge:
Informative Informative x 1 View List

HatshepsutTopic starter

Относно писането на старобългарски думи

Програмата може да се използва за традиционен български правопис (до 1945г.), но НЕ е пригодена за писане на старобългарски текст, т.е. не включва всичките букви на средновековната българска кирилица.
Програмата включва следните старобългарски букви:

Ѫ, Ѣ, Ѭ, Ѧ, Ѵ, S и Ы

Програмата не включва (и никога няма да бъдат добавени  :warn: ) следните букви:

Ѥ ѥ, Ѩ ѩ, Ꙋ, ꙋ (ук), Ѡ ѡ (омега), І і (йота), Ѳ ѳ (тита), Ѯ ѯ (кси) и Ѱ ѱ (пси)

Все пак, мога да препоръчам следното приблизително съответствие:

Ө ө може да се използва вместо Ѳ ѳ (изписват се по абсолютно същия начин)  :aha:
Ԝ ԝ може да се използва вместо Ѡ ѡ (изписват се по подобен начин)
Ҙ ҙ може да се използва вместо Ѯ ѯ (донякъде се изписват по подобен начин)

nasiovoivoda

Бих искал да попитам дали някой знае за програма или сайт, който поддържа всички варианти на българския правопис. От Дриновски до днешен.
Ако не се лъжа всички варианти на българското писмо бяха 5.
   -Дриновски
   -Иванчевски
   -Земеделски
   -Иванчевски
   -Комунистически (до днес)

HatshepsutTopic starter

Мой проект за дизайна на някои букви от разширената кирилица, в стил Българска кирилица

Първо уточнявам, че не съм дизайнер и нямам особен интерес към калиграфията, така че се извинявам, ако съм допуснал някои грешки при очертанията на буквите. Както е известно, при стила Българска кирилица малките букви на нормалния шрифт са сходни със стила на наклонения шрифт (Italic)
Аз специално съм се спрял на буквите Ѣ, Ѧ, Џ, L и Æ
Ето как изглеждат въпросните букви при нормален шрифт и при стил Italic:

Ѣ ѣ ~~ Ѣ ѣ
Ѧ ѧ ~~ Ѧ ѧ
Џ џ ~~ Џ џ
L l ~~ L l
Æ æ ~~ Æ æ



Similar topics (3)