ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 07.09.2021
Просмотров: 1689
Скачиваний: 1
Масштабы ошибок исследователя при трактовке рентгенограмм были изучены несколько десятилетий назад, когда во многих промышленно развитых странах было начато осуществление программ борьбы с туберкулезом. Значительная часть ранних исследований, выполненных Йерушалми (Yerushalmy) — специалистом по биологической статистике, — была направлена на изучение эффективности различных рентгенологических и флюорографических методов и оборудования.
Гипер-и гиподиагностика
Одно из предпринятых исследований проведено с целью установить влияние размеров рентгенограммы грудной клетки на результаты ее расшифровки. При этом исходили из предпосылки, что эти вариации играют гораздо меньшую роль, чем индивидуальные факторы рентгенолога [2]. Каждый из пяти участвовавших в исследовании специалистов не замечал (или просматривал) изменения на рентгенограммах примерно в 25% случаев (табл. 15). Когда спустя 3 месяца те же самые рентгенограммы повторно рассматривались теми же специалистами, то в 20% всех случаев они изменили свое первоначальное заключение относительно обнаруженных изменений (индивидуальная вариабельность результатов).
Дополнительные исследования подтвердили, что в 26—43% случаев может иметь место гиподиагностика [3, 7, 8]. Например, в Дании группа из трех опытных специалистов провела независимую оценку 5 000 неотобранных флюоро-грамм (см. табл. 15). Было установлено, что в среднем гиподиагностика имела место в 32% случаев, а гипердиагностика — в 2%. Эти наблюдения были затем подтверждены в Великобритании [ 10].
Большое исследование, проведенное в США, имело целью установить целесообразность периодических массовых флюорографий [4, 6]. Обследовано 15 000 студентов первого курса университета (см. табл. 15). Расшифровку флю-орограмм выполняли 50 специалистов (25 рентгенологов и 25 пульмонологов). Каждый участник исследования оценивал 3 000 флюорограмм, отобранных методом случайной выборки — таким образом, каждая флюорограмма была независимо «прочитана» 10 раз. Каждого студента, флюорограмма которого была расценена как положительная хотя бы одним специалистом, обследовали до-
Таблица
15
Ошибка
исследователя: гиподиагностика и
гипердиагностика при рентгенологическом
исследовании органов грудной клетки
(в основном результаты исследования,
взятые наугад)
, Гиподиагностика
Гипердиагностика
Исследование
(ссылка)
1.
5
рентгенологов-экспертов [2]
25
-
2.
Рентгенологи
с различным опытом работы [3]
27
1,7
3.
Массовая
рентгенография [4]
32
1,7
4.
Массовая
рентгенография, туберкулезный индекс
Дании [5]
32
1,6
5.
Массовое
обследование 15 000 студентов, 10-кратное
прочтение каждого снимка [6]
а)
все 50 рентгенологов
39
1,2
б)
5 отобранных «лучших» специалистов
из групп рентгенологов и пульмонологов
Группа
А
21
0,5
Группа
Б
26
0,3
полнительно
(культуральное исследование мокроты,
туберкулиновые тесты и томография) и
в дальнейшем наблюдали в течение всего
времени учебы в университете. В
конечном итоге небольшая группа
экспертов, которые располагали всей
необходимой информацией, оценила 249
флюорограмм как «несомненно положительные».
Вариабельность результатов, полученных
разными специалистами, была весьма
значительной. При анализе результатов
работы всех 50 специалистов было
установлено, что гиподиагностика имела
место в 39% случаев (249 «определенно
положительных» флюорограмм). В
противоположность этому гипердиагностика
отмечена в 1,2% случаев (156 флюорограмм).
Если принимать во внимание заключения
только 10 «лучших» специалистов (5
рентгенологов и 5 пульмонологов), то
частота гипо- и гипердиагностики будет
значительно ниже, но все-таки еще
достаточно высокой (см. табл. 15).
Влияние
опыта специалиста на результаты
интерпретации рентгенологических
данных
Исследование гипо- и гипердиагностики туберкулеза было проведено сотрудниками Научно-исследовательского института туберкулеза Токио. Анализ результатов интерпретации флюорограмм выполняли 192 врача, участвовавшие в Японской национальной программе выявления больных туберкулезом [ 11]. Особое внимание при этом уделяли корреляции результатов и опыта «чтения» рентгенологических данных (табл. 16).
Для независимой оценки были использованы флюорограммы 50 человек, состояние здоровья которых было хорошо известно организаторам исследования: 25 больных с подтвержденным диагнозом туберкулеза или других заболеваний легких, 5 человек с излеченным туберкулезом и 20 человек без какой-либо рентгенологической патологии. Специалисты, принимавшие участие в исследовании, имели опыт работы от менее 1 года до 10 лет и более и ежегодно смотрели от 1 000 до 20 000 снимков (см. табл. 16). Они должны были ответить только на один вопрос — нужно ли проводить дополнительное обследование этих людей. Если специалист не считал необходимым дополнительное обследование больного с патологией легких, то такую ситуацию расценивали как случай гиподиа-гностики. Заключение о необходимости дополнительного обследования человека без какой-либо рентгенологической патологии расценивали как случай гипердиагностики.
Частота гиподиагностики составила в среднем 21,8%, а гипердиагностики — 19,5%. Однако частота гиподиагностики у специалистов с опытом работы более 10 лет или у ежегодно «читающих» более 20 000 флюорограмм была ниже на 6—8% по сравнению с менее опытными врачами. Не было ни одного специалиста, который не сделал бы как минимум двух ошибок. Исследователи пришли к выводу, что в Японии при осуществлении массовой флюорографии не диагностируется каждый пятый случай активного туберкулеза легких.
Расхождения результатов интерпретации повторных рентгенограмм грудной клетки
Расхождения
результатов «чтения» флюорограмм
разными специалистами были отмечены
не только при использовании этого
метода для выявления больных и
диагностики туберкулеза, но и при
интерпретации результатов серийных
рентгенограмм в процессе наблюдения
за одними и теми же больными. Например,
в одном из исследований [6]
каждого
больного обследовали двукратно с
различными интервалами (всего было
изучено 9 тыс. пар снимков размерами
35,6 см • 43,0 см). Специалистам был задан
вопрос о динамике выявленных изменений
(наблюдается ли у больного улучшение,
ухудшение или отсутствуют какие-либо
изменения?). Результаты этого исследования
представлены в табл. 17. Независимо от
того, кто производил учет результатов
(2 группы, состоявшие из 3 рентгенологов
или 3 пульмонологов, или только 2
эксперта), были получены сходные данные.
Расхождения результатов были отмечены
в 27—30% случаев. Кроме того, отдельные
специалисты в 19—24% случаях иначе
оценивали свои же собственные описания
рентгенограмм.
Исследование Международного Союза борьбы
с туберкулезом (IUAT) рентгенологической классификации
изменений на снимках грудной клетки
Международный союз борьбы с туберкулезом (IUAT) организовал одно из наиболее важных широкомасштабных сравнительных исследований по расшифровке и интерпретации рентгенограмм грудной клетки. Основной целью этого исследования была разработка унифицированной номенклатуры и единой системы интерпретации рентгенологических данных, которые могли бы стать основой для создания международной классификации рентгенологических изменений в легких [ 12, 13].
Из нескольких сотен тысяч снимков, сделанных во время массовых рентгенологических обследований взрослого населения Норвегии, были отобраны 1 100. В этот набор вошли 200 снимков от больных с заразными формами туберкулеза легких, 400 снимков от больных с ранее перенесенным активным туберкулезом, 100 снимков от больных с минимальными изменениями, не требующими дополнительных консультаций или обследований, 300 снимков от людей без патологических изменений в легких и 100 снимков от пациентов с различными поражениями легких нетуберкулезной этиологии. Эти снимки были сгруппированы в 7 роликов, и с каждого ролика было сделано по 10 копий.
Учет результатов выполняли 90 врачей (рентгенологи и пульмонологи), имевших достаточные навыки этой работы. Восемьдесят экспертов работали в 9 странах (Чехословакия, Дания, Финляндия, Франция, Норвегия, Швеция, Великобритания, США и Югославия)1, где массовые флюорографические исследования выполнялись уже в течение многих лет. Десять экспертов были отобраны из числа специалистов, принимавших участие в различных национальных и международных проектах, осуществляемых ВОЗ.
Исследование было запланировано таким образом [13], чтобы в первую очередь определить частоту совпадения или расхождения результатов между отдельными специалистами, а не устанавливать величину «ошибки исследователя» типа гипо- или гипердиагностики [14]. Каждый специалист должен был самостоятельно ответить на ряд вопросов, подготовленных заранее. Большинство вопросов предусматривали только два варианта ответа — «да» или «нет». Например: «Имеются ли на снимке легких патологические изменения?»; «Имеется ли в данном случае каверна?»; «Должен ли клиницист уделить данному больному внимание?»
1
Названия стран даны в соответствии с
принятыми на момент исследования.
Оценка
полученных данных была проведена с
помощью специальной статистической
методики [15], при которой для каждого
вопроса была получена серия величин.
На основании этих величин были построены
кривые, которые характеризовали уровень
расхождения между различными специалистами
при ответе на данный вопрос (рис. 3).
Преимуществом этого метода является
то, что построенная таким образом кривая
могла быть представлена одним рисунком
— индексом. Этот индекс мог принимать
любые значения в интервале от 0 до 100,
отражая степень несогласия (индекс 0
означал отсутствие расхождений, а
значение 100 указывало на полное
расхождение). Наибольшее приближение
кривой к пункту 0 по обеим осям отражало
минимальную частоту расхождений.
Отклонение кривой или же ее удаление
от одной из осей указывало на возрастающую
частоту расхождений в оценках. Как
показал этот метод, частота расхождений
в ответах на первый из поставленных
вопросов была заметно меньше, чем в
ответах на третий вопрос.
Рис. 3
Расхождение между специалистами по классификации рентгенограмм3
(исследование IUAT).
Индекс расхождений по трем вопросам:
-
Имеется ли какая-либо патология органов дыхания?
-
Имеется ли какая-либо патология в лимфатических узлах?
-
Имеются ли какие-либо обызвествления в лимфатических узлах?
Индекс рассчитывался как суммарный процентный показатель расхождений в ответах, эквивалентный соответствующей точке на кривой, т. е. там, где кривая пересекает косую линию, исходящую из угла с точкой 0.
ш
X
о
5 о. s
\ |
|
|
|
|
|
□ |
|
|
|
|
\ |
|
|
|
\ |
1ндек |
с |
|
|
\\ |
|
\ |
|
|
pao вс |
сожде прос |
НИИ 1) |
|
|
\\ |
|
|
\ |
|
ВС вс |
прос прос |
2) 3) |
|
|
* > 1 \ |
i \ |
|
|
\ |
|
|
|
|
|
\ \ |
\ |
|
|
/ |
\ |
|
|
|
|
\ |
\ |
\ |
|
|
|
\ |
|
|
|
\ |
\ |
|
\ |
|
|
|
\ |
|
|
|
У |
|
|
|
|
|
|
\ |
|
/ |
|
|
|
|
- - |
|
|
|
\ |
0 10 20 30 40 50 60 70 80 90 100
Процент ответов «да» при наличии изменений на рентгенограмме
а
Источник: пункт 14 в списке литературы.
Сравнение степени расхождения в интерпретации рентгенограмм грудной клетки и бактериоскопии мазков мокроты
Подобное исследование было проведено IUAT для оценки степени расхождения между бактериологами, исследовавшими мазки мокроты на содержание КУМ (Дж. Найбой (J. Nyboe), неопубликованные данные, 1971 г.). Серия из 250 образцов мокроты была исследована независимо в 10 лабораториях опытными
специалистами-лаборантами.
На рис. 4 показаны кривые расхождения
трех критериев положительных результатов.
Степень расхождения была наименьшей
(индекс 10), когда критерий положительного
результата был по меньшей мере 8 КУМ;
он был немного выше (индекс 12), если, как
минимум, требовалось 3 КУМ. Степень
расхождения была наивысшей (индекс
18), когда критерием положительного
результата была 1 КУМ. Тем не менее даже
самая высокая степень расхождения
между специалистами-лаборантами была
значительно меньше, чем самая низкая
степень между специалистами-рентгенологами.
Рис.
4
Примеры
кривых расхождений при рентгенологических
и бактериологических исследованиях
35
—г
Рентгенологическое
исследование
0-
0
5 10 15 20 25 30 35
Процент расхождений при ответе «да»
Кривая
1 на рис. 4 иллюстрирует самый низкий
уровень расхождения (индекс 28),
отмеченный при ответе на вопрос «Имеется
ли каверна?». Гораздо более низкие
показатели расхождений имеют место
при ответе на вопрос «Имеются ли в мазке
мокроты КУМ?», даже при лимите, равном
одной кислото устойчивой бактерии.
Исследователи пришли к заключению о
значительно большей согласованности
среди специалистов в трактовке
результатов бактериоскопии мазков
мокроты вне зависимости от принятых
при этом критериев, чем среди рентгенологов
(см. главу 5 «Насколько достоверны
результаты бактериоскопического
исследования мазков мокроты?»).
Уровни расхождения при интерпретации рентгенограмм органов грудной клетки и выводы
В табл. 18 приведено несколько индексов расхождения, полученных при анализе ответов на некоторые другие вопросы. Выбор вопросов определялся их значением для правильной классификации рентгенологических данных. В таблицу включены вопросы, по которым были отмечены максимальные и минимальные несовпадения результатов.
Совершенно неожиданной была высокая степень несовпадения результатов при ответе на вопрос о наличии патологических изменений в легких. Также вызывает удивление частое расхождение ответов на вопрос о наличии в легких кальцинатов. Особенно удручающим был значительный разброс ответов на вопрос о наличии патологических изменений в лимфатических узлах, включая их обызвествление (одна из наиболее частых рентгенологических находок). Наибольшее совпадение (или наименьшее расхождение оценок) отмечено при ответах на вопрос о наличии каверн в легких. Эту информацию следует рассматривать в контексте необходимости проведения тех или иных медицинских мероприятий. Например, у 5% бактериовыделителей патологические изменения на рентгенограммах органов грудной клетки вообще не были обнаружены. У 17% — рентгенологи заподозрили наличие каких-то патологических изменений нетуберкулезной природы, а у 24% — специалисты не сочли необходимым проводить какие-либо медицинские мероприятия в отношении туберкулезного процесса. Если бы лечение назначали лишь тем больным, у которых не менее 50% специалистов обнаружили каверны, специфическую терапию получала бы только треть бактериовыделителей. С другой стороны, среди тех пациентов, у которых более 50% рентгенологов и пульмонологов обнаружили патологические изменения и высказали мнение о необходимости проведения лечения, было в 4 или 5 раз больше пациентов без бактериовыделения по дан-
Таблица 18
Международное исследование IUAT, проведенное по рентгенологической классификации: индексы расхождения по разным вопросам3
Индекс
Вопрос
расхождения
Есть ли патологические изменения в лимфатических узлах? 60
Есть ли в легких изменения, возможно, туберкулезной природы? 45
Есть ли кальцина™ в легких? 42
Есть
ли необызвествленные очаги, возможно,
туберкулезной 37
природы?
Есть ли изменения на рентгенограмме? 34
Нужно ли проводить какие-либо медицинские мероприятия? 31
а
Источник: пункт 14
в
списке литературы.
Есть
ли каверна? 28
ным
бактериоскопии мазков мокроты. Такая
же частота расхождений наблюдается
в больницах, где диагноз туберкулеза
обосновывают только рентгенологическими
данными [ 16].
Сопутствующая патология, прежде всего ВИЧ-инфекция, существенно изменяет рентгенологические проявления туберкулеза легких и затрудняет его диагностику. Описанные выше вариации в трактовке рентгенограмм грудной клетки выражаются как значительными расхождениями между отдельными специалистами, так и несовпадениями при повторном изучении снимков теми же рентгенологами. Это положение было документировано самыми опытными экспертами в области рентгенологии и пульмонологии еще за много десятилетий до распространения ВИЧ-инфекции. Клинические исследования, проведенные в период бурного нарастания частоты сочетания туберкулеза и СПИДа, убедительно доказали атипичность рентгенологической картины туберкулеза у больных с данной сочетанной патологией. Характерными изменениями при ней являются увеличение прикорневых и медиастинальных лимфатических узлов, поражение средних и нижних отделов легких, а также отсутствие типичных для туберкулеза инфильтратов с распадом [17]. Изменения на рентгенограммах у таких больных могут быть минимальными или вообще не определяться [ 18].
Две гипотетические стратегии по диагностике туберкулеза у больных с соче-танной патологией были исследованы в Малави, где ВИЧ-инфекция была обнаружена у 75% всех больных туберкулезом [ 19]. Согласно одной из стратегий у402 взрослых больных первым диагностическим мероприятием была рентгенография грудной клетки. Исследование мазков мокроты проводили в последующем, и только у больных с изменениями на рентгенограммах, подозрительными на туберкулез. Рентгенологическая картина у 172 больных, обследованных по этой стратегии, была расценена как нетуберкулезная. Между тем микобактерии туберкулеза методом бактериоскопии мазков мокроты были затем обнаружены у 13 (8%) из них, а всеми методами — бактериоскопией и/или посевом — у 53 (31%). Все эти больные могли бы быть пропущены при использовании данной стратегии скрининга туберкулеза. В то же время бактериовыделение с мокротой как при бактериоскопии, так и при посеве отсутствовало у 27% из 230 больных, которым назначалась противотуберкулезная химиотерапия по поводу рентгенологически заподозренного туберкулеза легких.
Вторая стратегия предусматривала первоочередное исследование мазков мокроты. Рентгенография легких проводилась в последующем, и только больным с отрицательными результатами бактериоскопии. Снимки грудной клетки, произведенные у 291 пациента, в 159 (55%) не выявили характерных для туберкулеза изменений, что стало основанием для исключения этого диагноза. Однако микобактерии туберкулеза затем были обнаружены при посевах мокроты у 40 (25%) этих больных. Таким образом, вторая из примененных стратегий диагностики привела бы к уменьшению числа пациентов, но ни один больной с положительными результатами бактериоскопии мазков мокроты не был бы пропущен. Однако рентгенография грудной клетки оказалась недостаточно чувствительной и в качестве второго шага при диагностике туберкулеза у больных с отрицательными результатами бактериоскопии. Это иллюстрировал тот факт, что у 47% из 132 больных с заподозренным на основании рентгенографии туберкулезом микобактерии не были обнаружены в последующем ни при бактериоскопии, ни при посеве.
Таким образом, суммарный опыт многих десятилетий сбора и детального анализа показал, что рентгенография грудной клетки не является достаточно надежным методом диагностики туберкулеза и наблюдения за его течением как у больных с сочетанной ВИЧ-инфекцией, так и без нее.
Литература
-
American Thoracic Society. Diagnostic standards and classification of tuberculosis in adults and children. American Journal of Respiratory and Critical Care Medicine, 2000, 161:1376-1395.
-
Birkelo C.C., Chamberlain W.E., Phelps P.S. Tuberculosis case finding: a companion of the effectiveness of various roentgenographic and photofluorographic methods. Journal of the American Medical Association, 1947, 133:359-366.
-
Garland L.H. On the reliability of roentgen survey procedures. American Journal of Roentegenology and Radium Therapeutic Nuclear Medicine, 1950, 64:32—41.
-
Yerushalmy J. et al. The role of dual reading in mass radiography. American Review of Tuberculosis, 1950, 61:443—464.
-
Groth-Petersen E., Lovgreen A., Thillemann J. On the reliability of the reading of photofluorograms and the value of dual reading. Acta Tuberculosis Scandinavica,
1952, 26:13—37.
-
Garland LH. Studies on the accuracy of diagnostic procedures. American Journal of Roentegenology and Radium Therapeutic Nuclear Medicine, 1959, 82:25—38.
-
Garland L.H. Conditions to be differentiated in the roentgen diagnosis of pulmonary tuber culosis. Annals of Internal Medicine, 1948, 29:878—888.
-
Newell R.R, Chamberlain WE, Rigler L. Descriptive classification of pulmonary shadows: a revelation of unreliability in the roentenographic diagnosis of tuberculosis. American Review of Tuberculosis, 1954, 69:566—584.
-
Groth-Petersen A., Moller V. Observer error in the interpretation of photofluoro-grams and the value of dual reading in the Danish mass campaign. Acta Tuberculosis Scandin avica, 1955, 30:209—230.
-
Cochrane A.L., Garland L.H. Observer error in the interpretation of chest films: an inter national investigation. Lancet, 1952, 2:505—509.
-
Nakamura K. et al. Studies on the diagnostic value of 70 mm radiophotograms by mirror camera and the reading ability of physicians. Kekkaku, 1970, 45:121—128.
-
Springett V.H. Results of the study on x-ray readings of the Ad Hoc Committee for the study of classification and terminology in tuberculosis. Bulletin of the International Union Against Tuberculosis and Lung Disease, 1968, 41:107—109.
-
Springett V.H. Results of the international study on x-ray classification. Conclusions. Bulletin of the International Union Against Tuberculosis, 1968, 41:125—129.
-
Waaler H.T. Descriptions of the study material and organization of the study. Bulletin of the International Union Against Tuberculosis, 1968, 41:110—114.
-
Nyboe J. Results of the international study on x-ray classification. Bulletin of the International Union Against Tuberculosis, 1968, 41:115—124.
-
WHO Expert Committee on Tuberculosis. Ninth report. Geneva, World Health Organization, 1974 (WHO Technical Report Series, No. 552).
-
Pitchenik A.E., Rubinson H.A. The radiographic appearance of tuberculosis in patients with the acquired immune deficiency syndrome (AIDS) and pre-AIDS. American Review of Respiratory Disease, 1985, 131:393—396.
-
Greenberg S.D. et al. Active pulmonary tuberculosis in patients with AIDS: spectrum of radiographic findings (including a normal appearance). Radiology, 1994,
193:115—119.
19. Harries
A.D. et al. Screening pulmonary tuberculosis suspects in Malawi:
testing
different strategies. Transactions
of the Royal Society of Tropical Medicine Hygiene,
1997, 91:416—419.
20. Enarson
D.A. et al. Management of tuberculosis: a guide for low-income
coun-
tries, 5th ed. Paris, International
Union Against Tuberculosis and Lung Disease,
2000.