Викисклад:Категории

Revision as of 16:23, 19 February 2023 by FuzzyBot (talk | contribs) (Updating to match new version of source page)

Shortcuts: COM:C • COM:CAT

Категории — средство программного обеспечения MediaWiki, специальная страница, предназначенная для группировки сходных страниц и файлов. На практике это означает отнесение страницы к определённой категории. Название категории является достаточным для определения её содержания, однако в некоторых случаях для идентификации категории может быть полезен поясняющий текст. Структура категорий является основным способом организации и поиска файлов на Викискладе. Очень важно, чтобы все файлы можно было найти, переходя по категориям в древе категорий. Для этого каждый файл должен быть помещён в категорию напрямую. Каждая категория, в свою очередь, должна быть помещена в более общие категории, образуя иерархическую структуру.

Краткое руководство

1. Как найти подходящую категорию

  • найти категорию с помощью поисковой системы (см. #Советы по категоризации)
  • проверить, как категоризованы сходные изображения (хотя некоторые из них могут быть некатегоризованы или категоризированы неверно)
  • попробовать воспользоваться инструментом tools:~daniel/WikiSense/CommonSense.php
  • начать поиск категории с более общих категорий, т.е. от общего к частному (Category:Topics)
  • начав с этих категорий, проверьте материнские категории и подкатегории, чтобы найти подходящие категории. Избегайте выбора слишком общих категорий.

2. Добавление категории в файл/изображение

  • выберите категорию при загрузке (в форме загрузки)
  • проставьте их вручную, добавив, например, [[Category:Foobar]] на странице описания файла (см. #Категоризация страниц)
  • используйте HotCat (см. Help:Gadget-HotCat)
  • используйте Cat-a-lot (см. Commons:Cat-a-lot)

Структура категорий на Викискладе

Принципы

Shortcut

Главные принципы:

Иерархичность

Структура категорий должна стремиться к мультииерархичности, с одной общей корневой категорией Category:CommonsRoot. Все категории (кроме CommonsRoot) должны быть включены в хотя бы одну другую категорию. Связь между первой и последней категорией не должна замыкаться (то есть категория не должна включать саму себя).

Принцип модульности

Страница (файл, категория) должна быть помещена в наиболее конкретную (специфическую или наиболее детализированную) категорию или категории, которые соответствуют этой странице (помещать конкретную страницу в общие категории не рекомендуется). Одна категория может иметь несколько родительских категорий (надкатегорий). Категория может объединять два (или более) различных критерия; такие категории называются «составными категориями» или «категориями пересечений». Например. корневая категория Церкви (Category:Churches) и корневая категория Россия (Category:Russia) имеют общую подкатегорию Церкви в России (Churches in Russia).

Принцип простоты

Этот принцип предлагает не сочетать слишком много разных критериев.

Принцип селективности

Мы не должны классифицировать элементы, которые относятся к разным субъектам, но в одной категории. Название категории должно быть однозначным и не омонимичным.

Принцип универсальности

Одинаковые элементы должны иметь одинаковые названия категорий для всех стран и на всех уровнях категоризации. Структура категоризации должна быть настолько системной и унифицированной, насколько это возможно, местные диалекты и терминология должны быть замещены (в т. ч. с помощью инструмента Template:Category redirect) в пользу универсальности, если это возможно. Ответвления похожей категоризации должны иметь аналогичную структуру.

Типы отображения связей между категориями

Структура категорий должна отражать иерархию понятий и идти от общего к частному. Структура использует и объединяет большое количество типов связей, т. е.:

  • Гипонимы: вид, тип… (не только в биологической таксономии): например, в категориях используется формулировка англ. ...sort/kind/type of…
  • Меронимы: часть… (обычно для географического деления, здания или комнаты, устройства или компонента и т. д.), в категориях используется формулировка англ. ...part of…, a member of…
  • Атрибуты:
    • Качественные и общие характеристики (цвет, форма, размер, способность или неспособность, национальность, техника, качество, награды...)
    • Местоположение: где, в…, из… англ. where, in…, from… (место / событие; место / здание; место / выставка; место / люди; страна / язык; источник / работа; фабрика или страна / продукт и т. д.)
    • Сроки: когда англ. when (время / событие; время / изображённая ситуация; время рождения, начала или строительства; время смерти, разрушения или прекращения существования и т. д.)
  • Связи с агентивностью и факторами влияния: (издатель / работа; устройство / продукт; компания / продукт; дисциплина или профессия / их предметы и термины; родители / дети; подчинение; владелец / собственность; инициатор / последователь; субъект / другие посвященные ему предметы или названный в честь него; предмет / его дубликат, подражание, изображение или символ и т. д. и т. п.)
  • Модификация: оригинальная / модифицированная; модифицированная / оригинальная (избегайте циклической структуры) — переименованный, перестроенный, перекомпонованный или преобразованный (трансформированный) предмет (субъект).

Основные категории

Категории, вложенные в корневую (самые верхние) формируют всю структуру:

  • Category:Topics — общая категория для сортировки по темам. Все медиафайлы должны быть категоризованы в этой категории для облегчения их поиска. Актуальные категории не должны включаться с помощью шаблонов.
  • Category:Copyright statuses — общая категория для сортировки по лицензиям. Все медиафайлы должны быть категоризованы по этим категориям по лицензиям. Этот тип категории включен во все шаблоны.
  • Category:Image sources — общая категория для сортировки по источнику (книги, коллекции, сайты, etc.). В основном добавляется с помощью шаблона.
  • Category:Media types — общая категория для сортировки по типу медиаконтента. Этот тип категоризации часто опускается для изображений, так как есть и другие, более эффективные способы сортировки.
  • Category:Commons — общая категория для сортировки служебных страниц и страниц (Commons:-, Help:-). Здесь нет медиафайлов. Переведенные страницы группируются здесь по категориям языков, используя «Category:Commons-ISO-LANGUAGE-CODE». Структура Category:Commons-en английских категорий — это пример организации для других языков. Не используйте два двоеточияв названиях категорий или страниц. См. это обсуждение и Help:Namespaces (пространство имён).
Субкатегория Category:Commons maintenance content, предназначена для обслуживания Wikimedia Commons global common contents. Она не переводится. Все медиафайлы должны быть категоризованы по первым четырем категориям, и только имеющие проблемы и нуждающиеся в исправлении файлы, должны иметь субкатегорию Category:Commons maintenance content.
  • Category:Users — категория содержит пользовательские галереи, изображения и тексты, сортированные, например, по языкам. Она также включает Category:User galleries, предназначенную для пользовательских (не тематических) галерей, которые не обязательно должны быть на английском.

Как использовать категории

Вы всегда должны помещать ваши закачки в категории и/или галереи по темам, чтобы другим было легче найти и использовать материалы.

Достаточно редко требуется создавать новую категорию. Перед тем как это сделать, удостоверьтесь, что вы знакомы с существующей структурой категорий, а также политиками Commons. Пожалуйста, посмотрите нет ли category scheme или commons project для вашей темы и следуйте соглашениям, описанным там.

Название категорий

Названия категориям даются на английском (см. Commons:Языковая политика) кроме некоторых исключений.

Имена категорий, относящихся к типам объектов или группам людей должны даваться во множественном числе: Category:Tools, Category:Artists, Category:Lakes, Category:Paintings, Category:Sculptures etc, в противоположность основным темам таким как (Category:History, Category:Weather, Category:Music, Category:Painting, Category:Sculpture) или конкретному объекту (отдельная постройка, памятник, художественная деятельность etc.).

Категории, группирующие подкатегории по имени должны именоваться «по имени» («by name»), а не «по алфавиту» (например, Category:Ships by name).

У нас всё ещё нет интернационализации для имен категорий, но эта проблема должна быть решена изменениями в движке MediaWiki (см. bugzilla:5638). Создание дублирующих групп категорий для каждого языка ни к чему хорошему не приведёт.

Для основного обсуждения механизма категоризации движка MediaWiki см. страницу руководства по категориям.

Категоризация страниц

Чтобы присвоить странице какую-либо категорию (будь это страница изображения, галереи или список других категорий), добавьте следующий код в её конец.

[[Category:Название категории]]

Например, если вы загрузили диаграмму, показывающую орбиты комет, вы должны добавить следующие категории на странице изображения:

[[Category:Astronomical diagrams]]
[[Category:Comets]]

Тогда ваша диаграмма будет отображаться в категориях Category:Astronomical diagrams, Comets.

Дополнительная информация по поиску подходящей категории или галереи размещена в разделе Find an appropriate category.

Создание новой категории

Чтобы создать новую категорию:

  1. Тщательно поищите категорию для вашего медиафайла.
  2. Найдите другие изображения (или галерею или другие страницы) которые должны быть помещены в новую категорию. Добавьте необходимую категорию в конец этой страницы и сохраните. Например, [[Category:Title]]. Новая категория будет выглядеть как красная ссылка внизу страницы.
  3. Кликните на нее — вы перейдёте к редактированию новой пустой страницы категории. Она редактируется точно также как и любая другая вики-страница.

Страница категории должна включать следующую информацию (перечислено в порядке важности):

  • Категории-ссылки, относящие эту категорию к одной или нескольким родительским. В нижней части новой страницы, вставить строки вида [[Category:Relevant categories]].
  • Краткий комментарий, описывающий содержимое категории, если её название неоднозначно. Подписи, в частности, языки, могут быть обозначены с помощью шаблонов, например, {{de|...}} для немецкого, {{en|...}} для английского и т. д. как перечислено в Commons:Templates for galleries); или используя {{Mld}} чтобы показать подпись на родном языке пользователя, если он один.
  • Если категория должна быть отсортирована не по названиям, а иначе, то добавьте {{DEFAULTSORT:}}. Например, сортировка по алфавиту не подойдет для категории о человеке. Для таких категорий после интервики вставьте строку вида {{DEFAULTSORT:Lastname, firstname}} для корректной сортировки. Подробнее см. meta:Categories#Sort key.

После создания категории следует, в большинстве случаев, связать её с Викиданными. Чтобы сделать это вручную, находим статью (о том, о чём категория) в Википедии — не важно, в русской или ещё какой — и переходим по ссылке «Элемент данных» на Викиданные, где:

  1. проверяем, что вошли в систему (не критично, но желательно);
  2. добавить ссылку: Другие сайты → commons (Викисклад) → Category:имя категории [1]
  3. жмём Enter.

Это — для существующей, только что созданной категории на Складе. Как альтернатива, в при её создании включить шаблон {{Wikidata Infobox|qid=Q▗▗▗▗▗▗▗}} указав вместо прочерков Q-номер сущности (виден в URL страницы Викиданных). И так и сяк о дальнейшей категоризации позаботятся.

See also #How to categorize: guidance by topic for guidance on specific classes of category, e.g. categories about #People.

Смотрите также #How to categorize: guidance by topic за дополнительной информацией о категоризации специфических классов, например, о людях #People.

If a category should be sorted according to a different string than the category title, there are two ways:

Defining a sortkey (sort string) for all parent categories:

{{DEFAULTSORT:sortkey}}
[[Category:Parent category A]]
[[Category:Parent category B]]
This will sort the category into all parent categories under the specified sortkey. For instance, the title of a category about a person would not be the right sort string. For such categories, insert just before the categories a line with the correct sort string like:
{{DEFAULTSORT:Lastname, Firstname}}

Defining a sortkey only for one of the parent categories:

[[Category:Parent category A|sortkey]]
[[Category:Parent category B]]
This will also overrides any maybe defined DEFAULTSORT for ‘Parent category A’.

The default sort order on Commons is:

! " # $ % & ' ( ) * + , - . / 0 9 : ; < = > ? @ A a Z z [ \ ] ^ _ ` { | } ~ É é τ – — 📚
  • Here the symbol should simply indicate a space as sortkey, which is always sorted first.
  • The first ‘dash’ (after the comma) is the Hyphen-minus - (Unicode U+002D, the standard ASCII minus sign on most keyboards). The last two dashes are the En dash (in HTML &ndash;) followed by the Em dash (&mdash;).
  • The two most commonly used sort keys on Commons are   (space) and *, after this !, #, +, -, ., :, ? and ~ are also often used.
  • The special sortkey τ (lowercase Greek letter Tau) is used to sort templates at the end of the related Commons-category, see for example Category:Transport templates sorted in Category:Transport. (Sorting in Commons is not case sensitive so only uppercase Τ (Tau) is shown.)
  • The special sortkey 📚 ({{Setcat}}) is used to sort image sets at the end of the related Commons-category, see for example Category:Cube; by image set sorted in Category:Cube.

See also: Meta:Help:Sorting#Sort modes for more information.

Переименование и перемещение категорий

См. Commons:Переименование категории.

Для более подходящей категоризации

Pages (including category pages) are categorized according to their subject, and not to their contents, because the contents are generally not a permanent feature of the category page; in particular, you can momentarily find inappropriate contents in a category page.

Example: Assume that Category:Spheres contains only pictures of crystal balls. You must not add Category:Glass in the category page, according to the current contents, because you can have spheres made with a great variety of materials. Normally, any picture showing a glass object would be already categorized in Category:Glass (or in a category of its substructure). So, if the Category:Spheres is really crowded with crystal balls pictures, it would be a better idea to create a new category page, like Category:Glass spheres or Category:Crystal balls, categorized in Category:Spheres and Category:Glass.

Generally files should only be in the most specific category that exists for certain topic. For example files in Category:Looking up the center of the Eiffel Tower should not also be in Category:Paris (see over-categorization below). If you do not find a category that fits your purpose, you can create it — but carefully read the section about using categories first.

This does not mean that an image only belongs in one category; it just means that images should not be in redundant or non-specific categories. For instance, an image of a Polar Bear being rescued from an iceberg by a helicopter should be in Category:Ursus maritimus, Category:Icebergs and Category:Rescue helicopters. It should not, however, be in Category:Ursidae, Category:Sea ice or Category:Aircraft.

Советы по категоризации

The categories (or galleries) you choose for your uploads should answer as many as possible of the following questions:

The above questions cover the main aspects of the image to be categorized. For some images it makes sense to use all, for other images only one or two are reasonable. In addition there are several other aspects of the images that can be used to categorize the image:

This last set is useful and important but should always be done in addition of the main set of criteria.

Categorization in Wikimedia Commons is more detailed and deep than categorization in Wikipedia projects. Compared to them, Commons has more categories for individual subjects – places, people, organizations, events, terms, etc. Almost every article on a Wikipedia can have a corresponding category on Commons. However, even if there exist more images of an ordinary person or incidental event, it is practical to group them into a special category and categorize that category instead of categorizing all similar images individually to an identical set of parent categories.

Поиск подходящей категории

To find appropriate categories for your uploads, you should navigate the category structure starting from a generic category. Narrow your search down to subcategories until you find the most specific category that fits the file you uploaded. You can navigate the category structure by following links to subcategories, or expanding the tree of subcategories by clicking on the little ▶ symbols on subcategory names. The Major categories section above provides a starting point, and the How to categorize: guidance by topic covers some topics more.

Излишняя категоризация

for the inclusion criteria (the equivalent of w:WP:OVERCAT) see Commons:Category inclusion criteria

 
Don't place an item into a category and its parent. For example, a black and white photo of the Eiffel Tower should be placed in Black and white photographs of the Eiffel Tower. It should not be placed in both that category and the Paris category at the same time.

Over-categorization is placing a file, category or other page in several levels of the same branch in the category tree. The general rule is always place an image in the most specific categories, and not in the levels above those. Exceptions to this rule are explained in the section below.

Example: An image needing to be categorized shows a yellow circle. This image should be placed in Category:Yellow circles. If it is also placed in Category:Circles, it is over-categorized. We already know that it's a circle, because all yellow circles are circles. Therefore, Category:Circles is redundant. Template:Uw-overcat can be used to advise users of this.

This applies to most files: As mentioned under the adjacent illustration, files in Category:Black and white photographs of the Eiffel Tower should not also be in Category:Paris, files in Category:Albert Einstein should not be in Category:Physicists from Germany and so on.

Why over-categorization is a problem

It's often assumed that the more categories an image is in, the easier it will be to find it. Another example: By that logic, every image showing a man should be in Category:Men, because even if you know nothing more about the person you're looking for than that he is a man, you'll be able to find it. The result is that the top category fills up, making it necessary to go through hundreds, or in this case more likely thousands of images to find the one you want. You probably won't find what you're looking for, and what's more, those who are looking for a generic picture of a man to illustrate an article like en:Man will find that they've drowned out among the movie stars, scientists and politicians.

On lower levels, the problem becomes less acute, since the number of images will be smaller — they can still easily reach into the hundreds, though. But there is still a problem: Let's go back to Einstein. I know that he's a physicist, so I'll look in the Category:Physicists category. I find an image of Einstein among the hundreds of images of other physicists, which I'm not too happy with, but it's the only one there. Since there was an image there, I assume that there are no more hidden elsewhere, rather than look further in Category:Physicists from Germany and thus find Category:Albert Einstein where there might be a better one. So over-categorization has led to two problems: The top category is cluttered, and users will stop looking for the most relevant category since they've reached one that has a relevant image.

Improper categorization of categories is a cause of over-categorization

Strange as it may sound, under-categorization can be a cause of over-categorization. When a category itself is not properly categorized, it can lead users to over-categorize files belonging in that category. An example of this: Category:Eivør Pálsdóttir was categorized only in Category:People by name. A user categorizing an image of her might then be tempted to also place the image in Category:Female vocalists from the Faroe Islands. The correct solution is to place the image only in Category:Eivør Pálsdóttir and to make that category a subcategory of Category:Female vocalists from the Faroe Islands. At that point, however, any images that were already placed into both categories become overcategorized and need to be manually removed from the parent category.

A related problem is erroneous categorization. Notting Hill is a district within the borough of Kensington and Chelsea in London. When it was created, Category:Notting Hill was placed directly in Category:London instead of in the Category:Royal Borough of Kensington and Chelsea subcategory, where it should have been placed. A user categorizing an image of Notting Hill might then be tempted to place it both in Category:Notting Hill and in Category:Royal Borough of Kensington and Chelsea. Instead, each image should be placed only in the most specific categories, and those categories should in turn be placed in their most specific categories.

When you encounter improperly categorized categories, please place them in the appropriate parent categories if you are able to do so. That will not only help avoid over-categorization, but it will also make it easier to move through the category tree.

Exception for images with more categorized subjects

A file that depicts only one relevant subject should not be over-categorized. Where a file depicts additional relevant subjects, and the additional subjects do not have their own subcategories, consideration can be given to temporarily categorizing the image in both the subcategory and the parent category.

For example, this situation might arise in the case of a photograph of three politicians, one of whom is Angela Merkel (who has her own Commons category), with two other politicians who do not yet have their own categories. While the image would undoubtedly be categorized in Category:Angela Merkel or one of its subcategories, it would typically be considered to be over-categorization to also include it in Category:Politicians of Germany. Users would, however, be unlikely to search for the two other politicians in the Merkel category. Ideally, we would create specific subcategories for the two other politicians (where warranted), or find other relevant subcategories (e.g. Category:Politicians of Bavaria or Category:Members of the FDP, etc.), that would enable us to avoid over-categorization. In some circumstances, however, we may need to temporarily categorize the image in Category:Politicians of Germany where other appropriate subcategories do not yet exist.

Countries may be categorized as part of multiple overlapping categories. For example, Category:India is in Category:Countries of South Asia as well as Category:Countries of Asia.

Also user categories are exempted of over-categorization as those are not visible to most viewers, and project users include them for many different purposes like sorting, stats, filling values for userboxes, etc.

Руководство по категоризации

For some categories, there is special guidance on how best to sort content within that category. This guidance can be found in a category scheme or a Commons project for your topic. There is also some categorizing information in this section and sometimes there is guidance at the top of the category's page, in the Category namespace. So, for instance, some guidance on categorizing content depicting people is at the top of Category:People, and some is in the section People below.

Structures

Content depicting Structures, e.g. Buildings and Tunnels, can be classified like this:

Structure Category. First check if there is already a Category for this specific structure.

  • If yes: put it in there.
  • If no: If you have more than two pictures: create a new Category, named after the structure. For example Category:Rheinbrücke Emmerich. Use the common name, not necessarily the English one.

Then you categorize the category (NOT each single picture!) under the following possibilities:

Afterwards, categorize the image by the way the structure is depicted, such as:

Also consider the part and the context visible:

Люди

Content depicting people should be put in categories which describe them, such as Category:Economists from the United States. Start exploring at Category:People.

Please see Commons:Suggested category scheme for people for details on how to name and organize these categories.

Пейзажи

Content depicting a given subject from a common vantage point are grouped in Views of Subject from Viewpoint categories such as Views of Cathedral of Seville from the Giralda. Such categories should be subcategories of both the subject's category (Cathedral of Seville in this example) and the viewpoint's category (Giralda in this example).

In this example, the Views of Cathedral of Seville from the Giralda category is not placed directly in the subject and viewpoint categories, but in Views of the Cathedral of Seville and Views from Giralda. Such intermediate categories are often necessary to create structure and avoid over-categorization, particularly for views of a city from a vantage point located within the city. For example, Views of Rome from the Pincio needs the intermediate category Views of Rome to avoid placing it directly in Rome, which would constitute over-categorization.

Тексты

Texts, such as scans of books, should normally have a category for each version of the scan and each edition of the text. Thus a book published in three separate editions would have a parent category for the book, three subcategories for each text, and further subcategories for the text as a jpeg, a DjVu, etc., assuming each version had actually been uploaded. (Categories would not be created for editions not held on Commons.) This is particularly important for files in formats other than DjVu and PDF, where the category is the only practical means of keeping the scans together; see eg. Category:The Chronicles of England, Scotland and Ireland, Holinshed, 1587 which contains 2857 jpeg images of page scans.

GLAMs

For categorization issues related to mass content donations from GLAMs (Galleries, Libraries, Archives & Museums), please see Commons:Guide to batch uploading#Categories.

Рабочий процесс категоризации

Currently, a bot checks if newly uploaded files are categorized in topical categories and attempts to categorize files that are not. Before 17 June 2015, CategorizationBot was responsible for this job. As of June 2019, SteinsplitterBot occasionally checks for uncategorized files. The workflow is the following:

  1. User uploads a new file and adds categories (or not).
  2. A bot checks if the file is categorized.
  3. Users categorize files further (e.g. category diffusion below)

Other, if manual, categorization workflows are possible :

  • Category filling: Use appropriate keywords in the search engine to find the files that should be in a given category, and put them there.
  • Category diffusing: Go to Category:Categories requiring diffusion, select a crowded category, create appropriate subcategories if needed, and move the files to the subcategories. Gadgets like Cat-a-lot and HotCat can help.

Категории с пометкой «HIDDENCAT»

Many non-topical categories are marked with __HIDDENCAT__ or {{Hiddencat}} on the category page. For example, see Category:PD NASA in edit mode.

While categories are generally visible on every page, categories marked __HIDDENCAT__ are only visible:

  • on the edit screen: at the end of the screen, below the edit box
  • on category pages:
    • on subcategories to the hidden category: in the normal location, but on a separate line with a smaller typeface and the label "Hidden categories."
    • on parent categories: in the same way as other categories
  • on file description pages and gallery pages: for logged-in users who have selected to "Show hidden categories" in their appearance preferences. This is activated for all newly registered users.

This feature is generally used for template-based categories, such as license tag based categories. For example, placing {{PD-old-100}} on a file description page adds the file to Category:Author died more than 100 years ago public domain images, which is marked with __HIDDENCAT__.

For more details, see the help section on hidden categories for Mediawiki (the software that Commons uses).

Шаблоны для категорий

Some templates are designed for use on category pages - see Category:Category namespace templates. If the category is linked to a Wikidata entry, then you can use:

which displays a summary of the topic's information that is available on Wikidata, and also auto-adds birth/death/name/monument ID categories.

Some of the more commonly used ones are Category:Category header templates such as:

Инструменты

  • Gadgets enabled through the user preferences
    • Cat-a-lot: A tool that helps with moving multiple files between categories or adding categories to search results. [documentation / talk] 
    • HotCatd Easily add / remove / change a category on a page, with name suggestions. [documentation / example / talk] 
    • Gallery Details: Adds a link in the toolbox to display galleries and categories (and Newimages and Search result pages) with extensive details from file description pages and links to easily mark an image without source, etc. If Pretty log is activated, it also works on Log pages. [documentation / talk] 
    • Place categories above content, but below image on file description pages.  Modifies the placement of categories on the user interface.
    • Add a link to category pages to search for the category name with the option "-incategory". This excludes files already in the category (doesn't work if the category was added by a template). [talk] 

См. также

  1. Раньше работало добавление свойства P373 «Commons category» через «добавить утверждение», но состоянию на январь 2019 года свойство Commons category (P373) больше поддерживается некоторыми шаблонами Викисклада.