object_visibility_features
Что означает
Считает среднее время просмотра и порядок просмотра объектов.
Object-признаки превращают mapping codes и visibility checkpoints в сигналы просмотра блоков, продуктов и контента.
Исходные события
Алгоритм
- Триггер: После каждого visibility checkpoint.
- Расчет: visible_ms_by_code, active_visible_ms_by_code, avg_visible_ms_by_code, first_seen_index_by_code, last_seen_index_by_code.
- Приоритет:
P0; рассчитывается сервером:Да. - Не просите SDK отправлять
object_visibility_featuresнапрямую: сервер выводит это событие из принятых source-событий или безопасных импортов.
Текущий статус реализации: отправляется текущим backend/app/services/derived_processor.py, когда присутствуют нужные source-сигналы.
Формат хранения
Хранится в sf_server_derived_events с derived_type = "object_visibility_features", derived_ts, source_event_id, если строка связана с конкретным source-событием, а также batch_id, session_id, mapping_version и payload_json.
Для агрегатов уровня сессии source_event_id может быть пустым; последнее состояние сессии также отражается в sf_session_snapshots, когда это применимо.
Пример payload
{
"derived_type": "object_visibility_features",
"source_event_id": "evt_example_or_empty",
"mapping_version": "map_active",
"payload": {
"visible_ms_by_code": "example",
"active_visible_ms_by_code": "example",
"avg_visible_ms_by_code": "example",
"first_seen_index_by_code": "example",
"last_seen_index_by_code": "example"
}
}Примеры и допустимые значения из Excel: reviews_block_visible_ms=12000; price_section_avg_ms=2400.
Крайние случаи
Если object_code unknown — хранить отдельно в unknown mapping, не использовать в clean ML.
Если обязательных checkpoints не хватает, снижайте confidence или помечайте payload как partial. Никогда не синтезируйте положительный intent-сигнал только из-за отсутствия события.
Дашборд
Ожидаемое окно live-debug: Видимость объектов.
Если строка относится к загруженной сессии, она также должна находиться в окне Лента сессии.
Использование в ML
saw_block, visible_ms, sequence features.
Используйте стабильные codes и buckets вместо сырого текста, сырых URL или строк из DOM. Отсутствующие значения должны быть явными (not_available, unknown, partial), чтобы CatBoost отличал отсутствие сигнала от отрицательного сигнала.
Использование в детекции ботов
Нереалистичная видимость большого числа объектов за короткое время — bot signal.
Логика детекции ботов должна комбинировать этот признак с независимыми поведенческими сигналами; эта страница не разрешает fingerprinting, cookies, canvas/WebGL/audio probes или сырые значения форм.
QA-проверки checklist
- Сгенерируйте перечисленные source-события в одной сессии.
- Запустите server-derived обработку для этой сессии.
- Проверьте, что
sf_server_derived_eventsсодержит строкуderived_type = "object_visibility_features"или что событие явно помечено как еще не реализованное. - Откройте окно live-debug дашборда
Видимость объектови проверьте, что строка ссылается обратно на эту страницу. - Проверьте, что
payload_jsonсодержит только безопасные поля из списка выше и не содержит сырые ПДн, query string, cookies или значения форм.