Краткое традиционное описание F-меры Ван Ризбергена
Классическая количественная мера достоверности моделей: F-мера Ван Ризбергена вряд ли нуждается в описании в данной статье, т.к. в Internet есть более чем достаточно ее прекрасных описаний из которых автор все же выделил бы работу [2].
Ниже приводится пространная выдержка из этой работы.
«Точность (precision) и полнота (recall) являются метриками которые используются при оценке большей части алгоритмов извлечения информации. Иногда они используются сами по себе, иногда в качестве базиса для производных метрик, таких как F-мера или R-Precision. Суть точности и полноты очень проста.
Точность системы в пределах класса — это доля документов действительно принадлежащих данному классу относительно всех документов которые система отнесла к этому классу.
Полнота системы — это доля найденных классификатором документов принадлежащих классу относительно всех документов этого класса в тестовой выборке.
Эти значения легко рассчитать на основании таблицы контингентности, которая составляется для каждого класса отдельно.
В таблице содержится информация сколько раз система приняла верное и сколько раз неверное решение по документам заданного класса. А именно:
- · TP — истино-положительное решение;
- · TN — истино-отрицательное решение;
- · FP — ложно-положительное решение;
- · FN — ложно-отрицательное решение.
Тогда, точность и полнота определяются следующим образом:
(1).
F-мера — характеристика, которая позволяет дать оценку достоверности модели одновременно по точности и полноте:
" (2).