Blame

b68e25 feagor 2025-12-07 11:27:03
1
# Pygments, типы токенов
2
3
Основная идея подсветки кода, как это реализовано в Pygments, заключается в том, что исходный текст сначала разбивается на небольшие фрагменты — токены, а каждому токену присваивается тип токена, который определяет его семантическую роль в коде (например, ключевое слово, строка или комментарий).
4
5
Тип токена затем используется для определения того, как этот фрагмент кода должен быть стилизован (например, "красный и жирный" для ключевых слов).
6
В Pygments используется иерархическая система типов токенов, где каждый тип является подтипом более общего. Основные (глобальные) типы токенов и их подтипы включают:
7
Основные типы токенов Pygments
ba67c2 feagor 2025-12-07 11:29:03
8
| **Token** | **Подтип** | **Описание** |
9
| --------------------- | ---------------------- | -------------------------------------------------------------------- |
10
| **Token.Keyword** | — | Ключевые слова языка программирования. |
11
| | Keyword.Builtin | Встроенное ключевое слово. |
12
| | Keyword.Control | Управляющая конструкция (например, `if`, `for`). |
13
| | Keyword.Type | Ключевое слово, обозначающее тип (например, `class`, `def`). |
14
| **Token.Name** | — | Идентификаторы: переменные, функции, классы. |
15
| | Name.Function | Имя функции. |
16
| | Name.Variable | Имя переменной. |
17
| | Name.Class | Имя класса. |
18
| **Token.Literal** | — | Литералы — постоянные значения. |
19
| | Literal.String | Строковый литерал (например, `"Hello"`). |
20
| | Literal.Number | Числовой литерал. |
21
| | Literal.Number.Integer | Целое число. |
22
| | Literal.Number.Float | Число с плавающей запятой. |
23
| **Token.Comment** | — | Комментарии в коде. |
24
| | Comment.Single | Однострочный комментарий. |
25
| | Comment.Multi | Многострочный комментарий. |
26
| | Comment.Doc | Документирующий комментарий. |
27
| **Token.Operator** | — | Оператор (например, `+`, `-`, `*`, `==`). |
28
| **Token.Punctuation** | — | Пунктуация (например, `[`, `(`, `,`, `;`). |
29
| **Token.Text** | — | Текст, не относящийся к другим токенам. |
30
| | Text.Whitespace | Пробельные символы. |
31
| **Token.Generic** | — | Специальные токены, часто для оформления вывода. |
32
| | Generic.Heading | Заголовок. |
33
| | Generic.Error | Текст ошибки. |
34
| **Token.Error** | — | Ошибочный токен, сигнализирующий о синтаксической ошибке. |
35
| **Token.Other** | — | Прочие данные, не распознанные парсером (например, HTML внутри PHP). |