Tagged PDF
Тегированный PDF (доступная структура PDF)
PDF, дополненный структурными тегами, которые определяют логический порядок чтения, заголовки, абзацы, таблицы и альтернативный текст, делая документ доступным для программ чтения с экрана и вспомогательных технологий.
Техническая деталь
Тегированные PDF содержат дерево структуры, основанное на записях /MarkInfo и /StructTreeRoot каталога документа. Стандартные типы структуры включают /Document, /Part, /Sect, /H1-H6, /P, /Table, /TR, /TD, /Figure, /Span и /Link. Каждый структурный элемент связан с отмеченным содержимым в потоке страницы через MCID (идентификаторы отмеченного содержимого). PDF/UA (ISO 14289) требует полной разметки тегами, альтернативного текста для изображений и правильного порядка чтения для полного соответствия требованиям доступности.
Пример
```javascript
// Tagged PDF: PDF manipulation example
import { PDFDocument } from 'pdf-lib';
const pdfDoc = await PDFDocument.load(fileBytes);
const pages = pdfDoc.getPages();
console.log(`Pages: ${pages.length}`);
```