Содержание

Заглавные и строчные буквы / Хабр

Я собрал здесь некоторые не очень очевидные факты о заглавных и строчных буквах, с которыми может столкнуться программист в работе. Многие из вас переводили строки во «все заглавные» (uppercase), «все строчные» (lowercase), «первую заглавную, а остальные строчные» (titlecase). Ещё более популярна операция сравнения без учёта регистра. В мировом масштабе такие операции могут быть весьма нетривиальны. Пост построен в виде «сборника заблуждений» с контрпримерами.

1. Если я переведу строку в uppercase или lowercase, число Unicode-символов не изменится.

Нет. В тексте могут попасться строчные лигатуры, которым не соответствует один символ в верхнем регистре. Например, при переводе в uppercase: fi (U+FB00) -> FI (U+0046, U+0049)

2. Лигатуры — изврат, ими никто не пользуется. Если их не учитывать, то я прав.

Нет. Некоторым буквам с диакритикой нет точного соответствия в другом регистре, поэтому приходится использовать комбинированный символ. Скажем, в языке африкаанс есть буква ʼn (U+0149). В верхнем регистре ей соответствует комбинация из двух символов: (U+02BC, U+004E). Если вам попадётся транслитерация арабского текста, вы можете столкнуться с (U+1E96), которой в верхнем регистре также нет односимвольного соответствия, поэтому придётся заменять на (U+0048, U+0331). В ваханском языке есть буква (U+01F0) с аналогичной проблемой. Вы можете возразить, что это экзотика, однако на африкаанс в википедии 23000 статей.

3. Ну хорошо, но давайте считать комбинированный символ (с участием modifying или combining code points) одним символом. Тогда длина всё же сохранится.

Нет. Есть, например, в немецком языке буква «эсцет» ß (U+00DF). При переводе в верхний регистр, она превращается в два символа SS (U+0053, U+0053).

4. Ладно-ладно, понял. Будем считать, что количество Unicode-символов может увеличиться, но не больше, чем вдвое.

Нет. Бывают специфические греческие буквы, например, (U+0390), которые превращаются в три Unicode-символа (U+0399, U+0308, U+0301)

5. Давайте про titlecase. Здесь всё просто: взял первый символ из слова, перевёл в uppercase, взял все последующие, перевёл в lowercase.

Нет. Вспомним те же лигатуры. Если слово в lowercase начинается с fl (U+FB02), то в uppercase лигатура превратится в FL (U+0046, U+004C), но в titlecase — в Fl (U+0046, U+006C). То же самое с ß, но с неё, теоретически, слова начинаться не могут.

6. Опять эти лигатуры! Хорошо, берём первый символ из слова, переводим в uppercase, если получилось больше одного символа, то первый оставляем, а остальные назад в lowercase. Тогда точно сработает.

Не сработает. Есть, например, диграф dz (U+01F3), который может использоваться в тексте на польском, словацком, македонском или венгерском языке. В uppercase ему соответствует диграф DZ (U+01F1), а в titlecase — диграф Dz (U+01F2). Есть ещё разные диграфы. Греческий же язык порадует вас приколами с ипогеграммени и просгеграммени (к счастью, в современных текстах такое редко встречается). В общем случае варианты uppercase и titlecase для символа могут быть различны, для них есть отдельные записи в стандарте Unicode.

7. Хорошо, но, по крайней мере, результат преобразования регистра символа в uppercase или lowercase не зависит от его позиции в слове.

Нет. К примеру, греческая заглавная сигма Σ (U+03A3) на конце слова превращается в строчную ς (U+03C2), а в середине — в σ (U+03C3).

8. Ох, ну ладно, греческую сигму обработаем отдельно. Но во всяком случае, один и тот же символ в одной и той же позиции в тексте преобразуется одинаково.

Нет. Скажем, в большинстве языков с латиницей строчный вариант для I (U+0049) — это i (U+0069), но не в турецком и азербайджанском. Там строчный вариант для I — это ı (U+0131), а заглавный вариант для i — это İ (U+0130). В Турции из-за этого в разнообразном софте порой наблюдаются фееричные баги. А если вам попадётся текст на литовском с проставленными ударениями, то, к примеру, заглавная Ì (U+00CC), которая превратится не в ì (U+00EC), а в (U+0069, U+0307, U+0300). В общем, результат преобразования зависит ещё и от языка. Большинство сложных случаев описано здесь.

9. Какой ужас! Ну хорошо, пусть мы теперь правильно преобразуем в uppercase и lowercase. Сравнить два слова без учёта регистра не представляет проблем: переводим оба в lowercase и сравниваем.

Здесь тоже немало подводных камней, которые вытекают из вышесказанного. Например, не сработает с немецкими straße и STRASSE (первое не изменится, второе превратится в strasse). Со многими другими описанными выше буквами тоже будут проблемы.

10. М-да… Может, тогда всё в uppercase?

И это не всегда сработает (хотя и гораздо чаще). Но, скажем, если вам попадётся запись STRAE (да, большая эсцет тоже есть в немецком и в Unicode), она не совпадёт со straße.

Для сравнений буквы преобразуются по специальной таблице Unicode — CaseFolding, по ней и обе ß, и SS превратятся в ss.

11. А-а-а, это ж капец какой-то!

Вот тут согласен.

Если у кого-то не отображаются какие-то символы, напишите мне личное сообщение, я заменю на картинку.

Отличие Прописных букв от Строчных с наглядными Примерами

Многие пользователи интернета, а также те, кто учится русскому языку, сталкиваются с непонимани­ем разницы между написанием слов с большой или маленькой букв. И если некоторые ориентируют­ ся хотя бы на то, в каком месте предложения располагается слово, то в случае, когда перед автором текста стоит задание — написать со строчной буквы или с прописной, то у него, как правило, возника­ют сложности.

Слово «прописные» у большинства ассоциируются с маленькими буквами, которые позволяют «написать» свои мысли в тексте. Однако это неверные ассоциации. Прописные буквы — это заглав­ные или большие. Запомнить это можно, если вспоминать выражение «прописные истины», то есть утвержденные правила правильного правописания.

Исходя, из изложенного выше, следует сделать вывод, что:

прописные буквы — это те, ко­торые называются большими или заглавными.

С прописной пишутся слова

1 — С прописной (большой) буквы пишутся имена, отчества, фамилии (в том числе двойные имена и фамилии с дефисным написанием), псевдонимы, прозвища.

  • Антон Павлович Чехов, Римский-Корсаков, Антоша Чехонте, Владимир Красное Солнышко.

2 — название населенного пункта, реки, планеты.

3 — Собственные имена, употребляемые в значении нарицательных, пишутся с прописной буквы в том случае, если они не утратили признак индивидуальности.

  • — Мы все глядим в Наполеоны…» (А. Пушкин).

— пишутся клички животных.

  •  — Шарик, Муська, Чара, Моська.

4 — названия действующих лиц, выраженные нарицательными именами, в баснях, сказках, драматических и некоторых других произведениях.

  • Уж, Сокол, Лиса.

5 — мифологические существа и божества.

  • Марс, Зевс, Юнона.

6 — Имена прилагательные, образованные от собственных имён, животных, мифологических существ при помощи суффиксов —ов—(—ев—), —ин—, пишутся с прописной буквы.

  • Платоновы сочинения, Варин дом, Муркины котята, Зевсов гнев.

7 — Имена прилагательные, образованные от собственных имен имеющие значение «имени такого-то», «памяти такого-то», то пишутся с прописной буквы.

  • Пушкинские чтения, Нобелевская премия.

8 — официальные и неофициальные названия государств, республик и других территориальных единиц.

  • Россия, Российская Федерация, Украина, Беларусь, Зауралье, Республика Мордовия.

9 — географические названия, в том числе дефисного написания.

  • Европа, Альпы, Москва, Санкт-Петербург, Волга, Орехово-Зуево.

10 — служебные слова, находящиеся в середине названия.

  • Ростов-на-Дону, Франкфурт-на-Майне, Рио-де-Жанейро.

11 — Если же такие служебные слова находятся в начале наименования, то пишутся с прописной буквы.

  • Лас-Вегас и т. п.

12 Нарицательные существительные, употреблённые в географических наименованиях в значении собственных, могут писаться как с прописной, так и со строчной буквы.

  • Белая Церковь, Ясная Поляна;
  • Земляной вал, Кузнецкий мост, Покровские ворота.

13 — астрономические названия.

  • Земля, Солнце, Малая Медведица, Млечный Путь.

14 — пишутся названия высших правительственных учреждений и организаций, а также названия некоторых международных организаций.

  • Совет Федерации, Конституционный Суд, Государственная Дума, Федеральное Собрание, Организация Объединённых Наций, Совет Европы.

15 — наименования высших государственных должностей и высших почётных званий.

  • Президент Российской Федерации, Председатель Правительства РФ, Верховный Главнокомандующий Вооруженными Силами РФ, Герой Российской Федерации.

16 — названия важнейших церковных организаций и учреждений.

  • Русская Православная Церковь, Московская Патриархия.

17- официальные названия высших религиозных должностных лиц (кроме служебных слов и местоимений).

  • Патриарх Московский и всея Руси, Папа Римский 

18 — названия культовых книг.

  • Библия,  Евангелие, Новый Завет, Псалтырь, Коран.

19 — первое слово в сложных названиях министерств, научных учреждений, высших учебных заведений, промышленных и торговых организаций, не имеющих единичного характера.

  • Министерство образования и науки Российской Федерации, Московский государственный областной университет, Дом книги, Камский автомобильный завод.

20 — общепринятые сокращённые наименования.

  • Большой театр (ср.: Государственный академический Большой театр), Третьяковская галерея (ср.: Государственная Третьяковская галерея).

21-Если же предлоги, частицы, входящие в состав иноязычных имен и фамилий словообразовательные единицы слились с фамилиями, именами, то они пишутся с прописной буквы.

  • Дон-Кихот, Ван-Гог.
  •  слова — Слова Бог, Аллах пишутся с прописной буквы

22 — в начале прямой речи;

23 — в начале цитаты;

Чтобы понять, чем различаются строчные и заглавные буквы, следует раскрыть смысл слова «строчные». Первое, что приходит на ум — это то, что буквы находятся в строке. То есть это малень­кие, из которых состоит все предложение.

Таким образом,

строчными называют маленькие буквы,

Со строчными пишутся слова

1 — Имена прилагательные, образованные от собственных имен при помощи суффикса —ск-.

  • пушкинская проза, лермонтовские традиции.

2 — Собственные имена, которые утратили признак- ставшие нарицательными.

  • наполеон (торт), донжуаны, ампер.

3 — Имена прилагательные в составе фразеологизмов пишутся со строчной буквы.

  • демьянова уха, филькина грамота и т. п.

4 — Слова планета, созвездие, туманность, комета пишутся в астрономических названиях со строчной буквы.

  • туманность Андромеды, планета Земля, созвездие Скорпион.

5 — Названия других должностей, учёных степеней, почётных званий и т. д. пишутся со строчной буквы.

  • доктор философских наук, член-корреспондент и др.

6 — Родовые термины в названиях церквей, икон пишутся со строчной буквы.

  • Троице-Сергиева лавра, икона Донской Божьей Матери, собор Парижской Богоматери.

7- пишутся названия растений, образованные от имён собственных.

  • иван-да-марья, маргаритка.

8 — пишутся предлоги, частицы, входящие в состав иноязычных имен и фамилий, а именно: ван, да, де, дер, ди, ле, ла, оф, фон, эд, эль.

  • Антуан де Сент-Экзюпери, фон Бисмарк.

9 — в восточных именах и фамилиях пишутся слова бей, заде, оглы, паша и т. п.

  • Измаил-бей, Турсун-заде, Сулейман-паша.

10 — названия церковных служб.

  • литургия, вечерня, утреня, всенощная и т. д.

11 — в устойчивых словосочетаниях в словах.

  • ради бога, бог знает что, боже мой и т. п.

12 — после первого и последующих слов предложения;

13 после запятой;

14 после точки с запятой;

15 после многоточия в одной фразе.

Прописная, заглавная и строчная буквы — это два типа символов, которые используются при написа­нии любого текста. Если запомнить ту информацию, которая представлена в этой публикации, то у копирайтера не возникнет путаницы при создании статьи по заданным критериям типа: «написать со строчной» или «писать только с прописной».

Для начинающих рекомендуем посетить страничку «Продолжи узоры».

Также, для развития моторики рук, рекомендуем Вам интересные картинки с раскрасками и занимательные уроки по рисованию.

Скачать 

Заглавные буквы Определение и значение

  • Основные определения
  • Викторина
  • Связанный контент
  • Примеры

Сохраните это слово!


Один из двух видов букв. Заглавные буквы, также называемые прописными буквами, крупнее строчных букв и часто формируются иначе. Заглавные буквы используются в начале предложения или имени собственного и могут использоваться для выражения уважения. Некоторые примеры: «Собака залаяла», Даниил, Господь и королева Елизавета.

ВИКТОРИНА

ВЫ ПРОЙДЕТЕ ЭТИ ГРАММАТИЧЕСКИЕ ВОПРОСЫ ИЛИ НАТЯНУТСЯ?

Плавно переходите к этим распространенным грамматическим ошибкам, которые ставят многих людей в тупик. Удачи!

Вопрос 1 из 7

Заполните пропуск: Я не могу понять, что _____ подарил мне этот подарок.

Слова рядом с заглавными буквами

использование заглавных букв, выпуск заглавных букв, использование заглавных букв, заглавная буква, заглавные буквы, взыскание с капитала, потеря капитала, капитально, рынок капитала, преступление, наказуемое смертной казнью

Новый словарь культурной грамотности, третье издание Авторское право © 2005 г., издательство Houghton Mifflin Harcourt Publishing Company. Опубликовано издательством Houghton Mifflin Harcourt Publishing Company. Все права защищены.

Слова, связанные с заглавными буквами

кепка, заглавная, majuscule

Как использовать заглавные буквы в предложении

  • Этим утром в Париже раздались выстрелы на второй день смертоносного насилия, которое ошеломило французскую столицу.

    Франция скорбит и охотится|Нико Хайнс, Кристофер Дики|8 января 2015 г.|DAILY BEAST

  • Бандитские татуировки все еще нарисованы на его лице, как алые буквы.

    Как хорошие папы могут изменить мир|Гэри Баркер, доктор философии, Майкл Кауфман|6 января 2015 г.|DAILY BEAST

  • Но тогда я бы посмотрел на письма, которые прислали люди.

    В выпускной школе для транс-женщин|Шэрон Адарло|27 декабря 2014|DAILY BEAST

  • Если бы эмбарго было эффективным, братья Кастро писали бы любовные письма Дювалье много лет назад.

    Хлопок Обамы одной рукой с Кастро|Дуг Макинтайр|24 декабря 2014|DAILY BEAST

  • Омела, должно быть, висела прямо напротив прохода на Кэпитал-Хилл.

    Подарок Конгресса, который продолжает приносить пользу|P. Дж. О’Рурк|20 декабря 2014|DAILY BEAST

  • «Капитал, капитал», — с готовностью замечал его светлость, когда не было другого выхода.

    The Pit Town Coronet, Том I (из 3) | Чарльз Джеймс Уиллс

  • Как маленькие буквы больше всего утомляют глаза, так и самые маленькие дела больше всего беспокоят нас.

    Pearls of Thought|Maturin M. Ballou

  • Когда мы говорим против одного основного порока, мы должны говорить против его противоположности; середина между ними есть точка добродетели.

    Жемчужины мысли|Матурин М. Баллоу

  • Луна взошла над перепуганной толпой, бредущей по сорока милям дороги между Мирутом и столицей Моголов.

    Красный год|Луи Трейси

  • Время от времени приходящие от него письма доказывают, что он был жив и здоров, по крайней мере, до трех месяцев назад.

    St. Martin’s Summer|Rafael Sabatini

Почему заглавные буквы называются «верхними» — теперь я знаю

Первое слово этого предложения немного отличается от остальных — оно начинается с заглавной буквы. В английском языке мы используем заглавные буквы , чтобы начинать предложения, обозначать имена собственные, а в эпоху Интернета мы кричим, ЕСЛИ НАМ НУЖНО. (Извините.) Это не что-то универсальное — арабский, иврит, грузинский и некоторые другие языки не имеют регистра, то есть нет такой вещи, как прописные или строчные буквы. Вполне вероятно, что древненемецкий и латинский языки, предшественники английского языка, также изначально были уникальными, но с течением времени они развили различия, которые мы используем сегодня.

Но изначально мы не называли их «верхний регистр» или «нижний регистр». И если подумать, эти имена не имеют интуитивного смысла. Конечно, «верхний» и «нижний» могут вроде заменять «больше» и «меньше», но это с натяжкой — эти слова на самом деле не описывают размер букв. Что касается «кейса», то это слово вообще не имеет ничего общего с размером букв.

Итак, откуда берутся «верхний регистр» и «нижний регистр»?

Печатные машины.

До появления печатных станков «прописные» и «строчные» буквы назывались «majuscule» или «minuscule» соответственно, что имеет определенный смысл. Эти названия произошли от латинских терминов maiuscula littera и minuscula littera , которые буквально переводятся как «немного большая буква» и «немного меньшая буква». Но когда подвижные шрифты стали все более популярными, понадобились приспособления, подобные показанным ниже.

На картинке выше изображено нечто, называемое печатным корпусом. Печатные станки восемнадцатого века использовали эти ящики — футляры — для хранения маленьких металлических блоков, называемых «типами», которые представляли собой буквы и другие символы. У каждого символа был свой маленький прямоугольник, что позволяло наборщику легко найти нужный. Наборщик брал правильные блоки из каждого отсека, прописывая все, что нужно было прописать. Вот как обычно были организованы отсеки:

Маленькие буквы, которые использовались чаще, находились в более доступном нижнем поле — «нижнем регистре». Заглавные буквы были в верхнем — «верхнем регистре».

Со временем выравнивание типа металла в корпусах эволюционировало дальше; к концу 1800-х, например, наборщики использовали поле, в котором прописные буквы располагались справа от строчных.

Автор записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *