ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 07.09.2021

Просмотров: 1689

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Масштабы ошибок исследователя при трактовке рентгенограмм были из­учены несколько десятилетий назад, когда во многих промышленно развитых странах было начато осуществление программ борьбы с туберкулезом. Значи­тельная часть ранних исследований, выполненных Йерушалми (Yerushalmy) — специалистом по биологической статистике, — была направлена на изучение эффективности различных рентгенологических и флюорографических методов и оборудования.



Гипер-и гиподиагностика

Одно из предпринятых исследований проведено с целью установить влияние размеров рентгенограммы грудной клетки на результаты ее расшифровки. При этом исходили из предпосылки, что эти вариации играют гораздо мень­шую роль, чем индивидуальные факторы рентгенолога [2]. Каждый из пяти участвовавших в исследовании специалистов не замечал (или просматривал) изменения на рентгенограммах примерно в 25% случаев (табл. 15). Когда спус­тя 3 месяца те же самые рентгенограммы повторно рассматривались теми же специалистами, то в 20% всех случаев они изменили свое первоначальное за­ключение относительно обнаруженных изменений (индивидуальная вариа­бельность результатов).

Дополнительные исследования подтвердили, что в 26—43% случаев может иметь место гиподиагностика [3, 7, 8]. Например, в Дании группа из трех опыт­ных специалистов провела независимую оценку 5 000 неотобранных флюоро-грамм (см. табл. 15). Было установлено, что в среднем гиподиагностика имела место в 32% случаев, а гипердиагностика — в 2%. Эти наблюдения были затем подтверждены в Великобритании [ 10].

Большое исследование, проведенное в США, имело целью установить целе­сообразность периодических массовых флюорографий [4, 6]. Обследовано 15 000 студентов первого курса университета (см. табл. 15). Расшифровку флю-орограмм выполняли 50 специалистов (25 рентгенологов и 25 пульмонологов). Каждый участник исследования оценивал 3 000 флюорограмм, отобранных ме­тодом случайной выборки — таким образом, каждая флюорограмма была неза­висимо «прочитана» 10 раз. Каждого студента, флюорограмма которого была расценена как положительная хотя бы одним специалистом, обследовали до-


Таблица 15

Ошибка исследователя: гиподиагностика и гипердиагностика при рентгенологическом исследовании органов грудной клетки (в основном результаты исследования, взятые наугад)


, Гиподиагностика Гипердиагностика

Исследование (ссылка)


1.

5 рентгенологов-экспертов [2]

25

-

2.

Рентгенологи с различным опытом работы [3]

27

1,7

3.

Массовая рентгенография [4]

32

1,7

4.

Массовая рентгенография, туберкулезный индекс Дании [5]

32

1,6

5.

Массовое обследование 15 000 студентов, 10-кратное прочтение каждого снимка [6]




а) все 50 рентгенологов

39

1,2


б) 5 отобранных «лучших» специалистов из групп рентгенологов и пульмонологов




Группа А

21

0,5


Группа Б

26

0,3


полнительно (культуральное исследование мокроты, туберкулиновые тесты и томография) и в дальнейшем наблюдали в течение всего времени учебы в уни­верситете. В конечном итоге небольшая группа экспертов, которые располагали всей необходимой информацией, оценила 249 флюорограмм как «несомненно положительные». Вариабельность результатов, полученных разными специали­стами, была весьма значительной. При анализе результатов работы всех 50 спе­циалистов было установлено, что гиподиагностика имела место в 39% случаев (249 «определенно положительных» флюорограмм). В противоположность это­му гипердиагностика отмечена в 1,2% случаев (156 флюорограмм). Если прини­мать во внимание заключения только 10 «лучших» специалистов (5 рентгеноло­гов и 5 пульмонологов), то частота гипо- и гипердиагностики будет значительно ниже, но все-таки еще достаточно высокой (см. табл. 15).




Влияние опыта специалиста на результаты интерпретации рентгенологических данных

Исследование гипо- и гипердиагностики туберкулеза было проведено сотруд­никами Научно-исследовательского института туберкулеза Токио. Анализ ре­зультатов интерпретации флюорограмм выполняли 192 врача, участвовавшие в Японской национальной программе выявления больных туберкулезом [ 11]. Особое внимание при этом уделяли корреляции результатов и опыта «чтения» рентгенологических данных (табл. 16).

Для независимой оценки были использованы флюорограммы 50 человек, со­стояние здоровья которых было хорошо известно организаторам исследования: 25 больных с подтвержденным диагнозом туберкулеза или других заболеваний легких, 5 человек с излеченным туберкулезом и 20 человек без какой-либо рент­генологической патологии. Специалисты, принимавшие участие в исследова­нии, имели опыт работы от менее 1 года до 10 лет и более и ежегодно смотрели от 1 000 до 20 000 снимков (см. табл. 16). Они должны были ответить только на один вопрос — нужно ли проводить дополнительное обследование этих людей. Если специалист не считал необходимым дополнительное обследование боль­ного с патологией легких, то такую ситуацию расценивали как случай гиподиа-гностики. Заключение о необходимости дополнительного обследования чело­века без какой-либо рентгенологической патологии расценивали как случай гипердиагностики.

Частота гиподиагностики составила в среднем 21,8%, а гипердиагностики — 19,5%. Однако частота гиподиагностики у специалистов с опытом работы более 10 лет или у ежегодно «читающих» более 20 000 флюорограмм была ниже на 6—8% по сравнению с менее опытными врачами. Не было ни одного специали­ста, который не сделал бы как минимум двух ошибок. Исследователи пришли к выводу, что в Японии при осуществлении массовой флюорографии не диа­гностируется каждый пятый случай активного туберкулеза легких.



Расхождения результатов интерпретации повторных рентгенограмм грудной клетки


Расхождения результатов «чтения» флюорограмм разными специалистами бы­ли отмечены не только при использовании этого метода для выявления боль­ных и диагностики туберкулеза, но и при интерпретации результатов серийных рентгенограмм в процессе наблюдения за одними и теми же больными. Напри­мер, в одном из исследований [6] каждого больного обследовали двукратно с различными интервалами (всего было изучено 9 тыс. пар снимков размерами 35,6 см • 43,0 см). Специалистам был задан вопрос о динамике выявленных изме­нений (наблюдается ли у больного улучшение, ухудшение или отсутствуют ка­кие-либо изменения?). Результаты этого исследования представлены в табл. 17. Независимо от того, кто производил учет результатов (2 группы, состоявшие из 3 рентгенологов или 3 пульмонологов, или только 2 эксперта), были получены сходные данные. Расхождения результатов были отмечены в 27—30% случаев. Кроме того, отдельные специалисты в 19—24% случаях иначе оценивали свои же собственные описания рентгенограмм.

Исследование Международного Союза борьбы

с туберкулезом (IUAT) рентгенологической классификации

изменений на снимках грудной клетки

Международный союз борьбы с туберкулезом (IUAT) организовал одно из на­иболее важных широкомасштабных сравнительных исследований по расшиф­ровке и интерпретации рентгенограмм грудной клетки. Основной целью этого исследования была разработка унифицированной номенклатуры и единой си­стемы интерпретации рентгенологических данных, которые могли бы стать ос­новой для создания международной классификации рентгенологических изме­нений в легких [ 12, 13].

Из нескольких сотен тысяч снимков, сделанных во время массовых рентгено­логических обследований взрослого населения Норвегии, были отобраны 1 100. В этот набор вошли 200 снимков от больных с заразными формами туберкулеза легких, 400 снимков от больных с ранее перенесенным активным туберкулезом, 100 снимков от больных с минимальными изменениями, не требующими допол­нительных консультаций или обследований, 300 снимков от людей без патоло­гических изменений в легких и 100 снимков от пациентов с различными пора­жениями легких нетуберкулезной этиологии. Эти снимки были сгруппированы в 7 роликов, и с каждого ролика было сделано по 10 копий.

Учет результатов выполняли 90 врачей (рентгенологи и пульмонологи), имевших достаточные навыки этой работы. Восемьдесят экспертов работали в 9 странах (Чехословакия, Дания, Финляндия, Франция, Норвегия, Швеция, Великобритания, США и Югославия)1, где массовые флюорографические ис­следования выполнялись уже в течение многих лет. Десять экспертов были от­обраны из числа специалистов, принимавших участие в различных националь­ных и международных проектах, осуществляемых ВОЗ.

Исследование было запланировано таким образом [13], чтобы в первую оче­редь определить частоту совпадения или расхождения результатов между от­дельными специалистами, а не устанавливать величину «ошибки исследовате­ля» типа гипо- или гипердиагностики [14]. Каждый специалист должен был самостоятельно ответить на ряд вопросов, подготовленных заранее. Большин­ство вопросов предусматривали только два варианта ответа — «да» или «нет». Например: «Имеются ли на снимке легких патологические изменения?»; «Име­ется ли в данном случае каверна?»; «Должен ли клиницист уделить данному больному внимание?»

1 Названия стран даны в соответствии с принятыми на момент исследования.


Оценка полученных данных была проведена с помощью специальной ста­тистической методики [15], при которой для каждого вопроса была получена серия величин. На основании этих величин были построены кривые, которые характеризовали уровень расхождения между различными специалистами при ответе на данный вопрос (рис. 3). Преимуществом этого метода является то, что построенная таким образом кривая могла быть представлена одним рисун­ком — индексом. Этот индекс мог принимать любые значения в интервале от 0 до 100, отражая степень несогласия (индекс 0 означал отсутствие расхождений, а значение 100 указывало на полное расхождение). Наибольшее приближение кривой к пункту 0 по обеим осям отражало минимальную частоту расхождений. Отклонение кривой или же ее удаление от одной из осей указывало на возрас­тающую частоту расхождений в оценках. Как показал этот метод, частота рас­хождений в ответах на первый из поставленных вопросов была заметно мень­ше, чем в ответах на третий вопрос.

Рис. 3

Расхождение между специалистами по классификации рентгенограмм3

(исследование IUAT).

Индекс расхождений по трем вопросам:

  1. Имеется ли какая-либо патология органов дыхания?

  2. Имеется ли какая-либо патология в лимфатических узлах?

  3. Имеются ли какие-либо обызвествления в лимфатических узлах?

Индекс рассчитывался как суммарный процентный показатель расхождений в ответах, эквивалентный соответствующей точке на кривой, т. е. там, где кривая пересекает ко­сую линию, исходящую из угла с точкой 0.


ш

X

о 5 о. s

100 90 80 70 60 50 40 30 20 10 0



\










\




\

1ндек

с



\\


\



pao вс

сожде прос

НИИ

1)



\\



\


ВС

вс

прос прос

2) 3)



* >

1 \

i

\



\






\ \

\



/

\





\

\

\




\




\

\


\




\




У







\


/




- -




\

0 10 20 30 40 50 60 70 80 90 100

Процент ответов «да» при наличии изменений на рентгенограмме

а

Источник: пункт 14 в списке литературы.

Сравнение степени расхождения в интерпретации рентгенограмм грудной клетки и бактериоскопии мазков мокроты

Подобное исследование было проведено IUAT для оценки степени расхож­дения между бактериологами, исследовавшими мазки мокроты на содержание КУМ (Дж. Найбой (J. Nyboe), неопубликованные данные, 1971 г.). Серия из 250 образцов мокроты была исследована независимо в 10 лабораториях опытными


специалистами-лаборантами. На рис. 4 показаны кривые расхождения трех критериев положительных результатов. Степень расхождения была наименьшей (индекс 10), когда критерий положительного результата был по меньшей мере 8 КУМ; он был немного выше (индекс 12), если, как минимум, требовалось 3 КУМ. Степень расхождения была наивысшей (индекс 18), когда критерием положительного результата была 1 КУМ. Тем не менее даже самая высокая сте­пень расхождения между специалистами-лаборантами была значительно мень­ше, чем самая низкая степень между специалистами-рентгенологами.

Рис. 4

Примеры кривых расхождений при рентгенологических и бактериологических исследованиях


35 —г



Рентгенологическое исследование


0-


0 5 10 15 20 25 30 35 Процент расхождений при ответе «да»


Кривая 1 на рис. 4 иллюстрирует самый низкий уровень расхождения (ин­декс 28), отмеченный при ответе на вопрос «Имеется ли каверна?». Гораздо более низкие показатели расхождений имеют место при ответе на вопрос «Имеются ли в мазке мокроты КУМ?», даже при лимите, равном одной кислото устойчивой бактерии. Исследователи пришли к заключению о значительно большей согла­сованности среди специалистов в трактовке результатов бактериоскопии мазков мокроты вне зависимости от принятых при этом критериев, чем среди рентгено­логов (см. главу 5 «Насколько достоверны результаты бактериоскопического ис­следования мазков мокроты?»).



Уровни расхождения при интерпретации рентгенограмм органов грудной клетки и выводы

В табл. 18 приведено несколько индексов расхождения, полученных при анали­зе ответов на некоторые другие вопросы. Выбор вопросов определялся их зна­чением для правильной классификации рентгенологических данных. В табли­цу включены вопросы, по которым были отмечены максимальные и минималь­ные несовпадения результатов.

Совершенно неожиданной была высокая степень несовпадения результатов при ответе на вопрос о наличии патологических изменений в легких. Также вы­зывает удивление частое расхождение ответов на вопрос о наличии в легких кальцинатов. Особенно удручающим был значительный разброс ответов на во­прос о наличии патологических изменений в лимфатических узлах, включая их обызвествление (одна из наиболее частых рентгенологических находок). На­ибольшее совпадение (или наименьшее расхождение оценок) отмечено при от­ветах на вопрос о наличии каверн в легких. Эту информацию следует рассмат­ривать в контексте необходимости проведения тех или иных медицинских мероприятий. Например, у 5% бактериовыделителей патологические измене­ния на рентгенограммах органов грудной клетки вообще не были обнаружены. У 17% — рентгенологи заподозрили наличие каких-то патологических изме­нений нетуберкулезной природы, а у 24% — специалисты не сочли необходи­мым проводить какие-либо медицинские мероприятия в отношении туберку­лезного процесса. Если бы лечение назначали лишь тем больным, у которых не менее 50% специалистов обнаружили каверны, специфическую терапию получала бы только треть бактериовыделителей. С другой стороны, среди тех пациентов, у которых более 50% рентгенологов и пульмонологов обнаружили патологические изменения и высказали мнение о необходимости проведения лечения, было в 4 или 5 раз больше пациентов без бактериовыделения по дан-

Таблица 18

Международное исследование IUAT, проведенное по рентгенологической классификации: индексы расхождения по разным вопросам3

Индекс

Вопрос

расхождения

Есть ли патологические изменения в лимфатических узлах? 60

Есть ли в легких изменения, возможно, туберкулезной природы? 45

Есть ли кальцина™ в легких? 42

Есть ли необызвествленные очаги, возможно, туберкулезной 37
природы?

Есть ли изменения на рентгенограмме? 34

Нужно ли проводить какие-либо медицинские мероприятия? 31

а Источник: пункт 14 в списке литературы.


Есть ли каверна? 28
ным бактериоскопии мазков мокроты. Такая же частота расхождений наблюда­ется в больницах, где диагноз туберкулеза обосновывают только рентгенологи­ческими данными [
16].

Сопутствующая патология, прежде всего ВИЧ-инфекция, существенно из­меняет рентгенологические проявления туберкулеза легких и затрудняет его диагностику. Описанные выше вариации в трактовке рентгенограмм грудной клетки выражаются как значительными расхождениями между отдельными специалистами, так и несовпадениями при повторном изучении снимков теми же рентгенологами. Это положение было документировано самыми опытными экспертами в области рентгенологии и пульмонологии еще за много десятиле­тий до распространения ВИЧ-инфекции. Клинические исследования, прове­денные в период бурного нарастания частоты сочетания туберкулеза и СПИДа, убедительно доказали атипичность рентгенологической картины туберкулеза у больных с данной сочетанной патологией. Характерными изменениями при ней являются увеличение прикорневых и медиастинальных лимфатических уз­лов, поражение средних и нижних отделов легких, а также отсутствие типичных для туберкулеза инфильтратов с распадом [17]. Изменения на рентгенограммах у таких больных могут быть минимальными или вообще не определяться [ 18].

Две гипотетические стратегии по диагностике туберкулеза у больных с соче-танной патологией были исследованы в Малави, где ВИЧ-инфекция была обна­ружена у 75% всех больных туберкулезом [ 19]. Согласно одной из стратегий у402 взрослых больных первым диагностическим мероприятием была рентгеногра­фия грудной клетки. Исследование мазков мокроты проводили в последующем, и только у больных с изменениями на рентгенограммах, подозрительными на туберкулез. Рентгенологическая картина у 172 больных, обследованных по этой стратегии, была расценена как нетуберкулезная. Между тем микобактерии ту­беркулеза методом бактериоскопии мазков мокроты были затем обнаружены у 13 (8%) из них, а всеми методами — бактериоскопией и/или посевом — у 53 (31%). Все эти больные могли бы быть пропущены при использовании данной стратегии скрининга туберкулеза. В то же время бактериовыделение с мокротой как при бактериоскопии, так и при посеве отсутствовало у 27% из 230 больных, которым назначалась противотуберкулезная химиотерапия по поводу рентгено­логически заподозренного туберкулеза легких.

Вторая стратегия предусматривала первоочередное исследование мазков мокроты. Рентгенография легких проводилась в последующем, и только боль­ным с отрицательными результатами бактериоскопии. Снимки грудной клет­ки, произведенные у 291 пациента, в 159 (55%) не выявили характерных для ту­беркулеза изменений, что стало основанием для исключения этого диагноза. Однако микобактерии туберкулеза затем были обнаружены при посевах мок­роты у 40 (25%) этих больных. Таким образом, вторая из примененных страте­гий диагностики привела бы к уменьшению числа пациентов, но ни один больной с положительными результатами бактериоскопии мазков мокроты не был бы пропущен. Однако рентгенография грудной клетки оказалась недо­статочно чувствительной и в качестве второго шага при диагностике тубер­кулеза у больных с отрицательными результатами бактериоскопии. Это ил­люстрировал тот факт, что у 47% из 132 больных с заподозренным на основа­нии рентгенографии туберкулезом микобактерии не были обнаружены в по­следующем ни при бактериоскопии, ни при посеве.

Таким образом, суммарный опыт многих десятилетий сбора и детального анализа показал, что рентгенография грудной клетки не является достаточно надежным методом диагностики туберкулеза и наблюдения за его течением как у больных с сочетанной ВИЧ-инфекцией, так и без нее.




Литература

  1. American Thoracic Society. Diagnostic standards and classification of tuberculosis in adults and children. American Journal of Respiratory and Critical Care Medicine, 2000, 161:1376-1395.

  2. Birkelo C.C., Chamberlain W.E., Phelps P.S. Tuberculosis case finding: a com­panion of the effectiveness of various roentgenographic and photofluorographic methods. Journal of the American Medical Association, 1947, 133:359-366.

  3. Garland L.H. On the reliability of roentgen survey procedures. American Journal of Roentegenology and Radium Therapeutic Nuclear Medicine, 1950, 64:32—41.

  4. Yerushalmy J. et al. The role of dual reading in mass radiography. American Review of Tuberculosis, 1950, 61:443—464.

  5. Groth-Petersen E., Lovgreen A., Thillemann J. On the reliability of the reading of photofluorograms and the value of dual reading. Acta Tuberculosis Scandinavica,

1952, 26:13—37.

  1. Garland LH. Studies on the accuracy of diagnostic procedures. American Journal of Roentegenology and Radium Therapeutic Nuclear Medicine, 1959, 82:25—38.

  2. Garland L.H. Conditions to be differentiated in the roentgen diagnosis of pul­monary tuber culosis. Annals of Internal Medicine, 1948, 29:878—888.

  3. Newell R.R, Chamberlain WE, Rigler L. Descriptive classification of pulmonary shadows: a revelation of unreliability in the roentenographic diagnosis of tubercu­losis. American Review of Tuberculosis, 1954, 69:566—584.

  4. Groth-Petersen A., Moller V. Observer error in the interpretation of photofluoro-grams and the value of dual reading in the Danish mass campaign. Acta Tuberculosis Scandin avica, 1955, 30:209—230.


  1. Cochrane A.L., Garland L.H. Observer error in the interpretation of chest films: an inter national investigation. Lancet, 1952, 2:505—509.

  2. Nakamura K. et al. Studies on the diagnostic value of 70 mm radiophotograms by mirror camera and the reading ability of physicians. Kekkaku, 1970, 45:121—128.

  3. Springett V.H. Results of the study on x-ray readings of the Ad Hoc Committee for the study of classification and terminology in tuberculosis. Bulletin of the International Union Against Tuberculosis and Lung Disease, 1968, 41:107—109.

  4. Springett V.H. Results of the international study on x-ray classification. Conclusions. Bulletin of the International Union Against Tuberculosis, 1968, 41:125—129.

  5. Waaler H.T. Descriptions of the study material and organization of the study. Bulletin of the International Union Against Tuberculosis, 1968, 41:110—114.


  1. Nyboe J. Results of the international study on x-ray classification. Bulletin of the International Union Against Tuberculosis, 1968, 41:115—124.

  2. WHO Expert Committee on Tuberculosis. Ninth report. Geneva, World Health Organization, 1974 (WHO Technical Report Series, No. 552).

  3. Pitchenik A.E., Rubinson H.A. The radiographic appearance of tuberculosis in patients with the acquired immune deficiency syndrome (AIDS) and pre-AIDS. American Review of Respiratory Disease, 1985, 131:393—396.

  4. Greenberg S.D. et al. Active pulmonary tuberculosis in patients with AIDS: spec­trum of radiographic findings (including a normal appearance). Radiology, 1994,

193:115—119.

19. Harries A.D. et al. Screening pulmonary tuberculosis suspects in Malawi: testing
different strategies.
Transactions of the Royal Society of Tropical Medicine Hygiene,

1997, 91:416—419.

20. Enarson D.A. et al. Management of tuberculosis: a guide for low-income coun-
tries, 5th ed. Paris,
International Union Against Tuberculosis and Lung Disease,

2000.