close

Anmelden

Neues Passwort anfordern?

Anmeldung mit OpenID

Dr. Götz Fabry Vorlesung Medizinische Psychologie 26.04.2013

EinbettenHerunterladen
Dr. Götz Fabry
Vorlesung Medizinische Psychologie
26.04.2013 Methodische Grundlagen I: Wie Wissen entsteht
Der Anspruch, dass der Arzt sein Handeln an wissenschaftlichen Erkenntnissen orientieren soll, erscheint
so selbstverständlich, dass man meinen könnte, es sei überflüssig, extra darauf hinzuweisen. Allerdings
zeigt sich immer wieder, dass zwischen wissenschaftlicher Erkenntnis auf der einen und ärztlicher Praxis
auf der anderen Seite erhebliche Differenzen bestehen. Die Gründe dafür sind vielfältig und komplexer
als es auf den ersten Blick vielleicht erscheinen mag. Der wichtigste Grund ist mit Sicherheit der, dass
der Charakter der Medizin als einer praktischen Wissenschaft (im Unterschied zu einer theoretischen
Wissenschaft wie z.B. der Physik oder der Biologie) häufig verkannt wird. Während es nämlich das oberste Ziel theoretischer Wissenschaften ist, Erkenntnis um ihrer selbst willen zu betreiben, geht es bei
praktischen Wissenschaften in erster Linie darum, individuelle Probleme zu lösen. Selbstverständlich haben auch die Erkenntnisse theoretischer Wissenschaften praktische Bedeutung, diese ist aber nicht das
oberste Ziel sondern ein willkommener Nebeneffekt. Für die Medizin dagegen lässt sich Ähnliches nicht
behaupten, ganz im Gegenteil. Hier geht es nämlich von Anfang an darum, Erkenntnis nicht um ihrer
selbst willen zu suchen, sondern nur deshalb, weil man einen Patienten heilen oder zumindest leidmindernd behandeln will. Ein wesentlicher Teil des nicht umsonst immer wieder als „Kunst“ bezeichneten
ärztlichen Handelns besteht also darin, von wissenschaftlichen Erkenntnissen so Gebrauch zu machen,
dass sie dazu beitragen, das Problem des individuellen Patienten besser verstehen und lösen zu können.
Bei diesem Schritt handelt es sich nicht lediglich um eine simple „Anwendung“ wissenschaftlicher Erkenntnisse, sondern um eine eigenständige Kompetenz, die nicht nur systematisch geschult und erworben, sondern auch ihrerseits wissenschaftlich beforscht werden muss.
Ein wichtiger Baustein, um wissenschaftliche Erkenntnis für die ärztliche Praxis nutzen zu können, ist das
Wissen darüber, wie eine wissenschaftliche Untersuchung überhaupt aufgebaut ist, welcher Voraussetzungen es zu ihrer Durchführung bedarf und wie vor diesem Hintergrund die Gültigkeit ihrer Ergebnisse
zu bewerten sind. Dazu ist es unverzichtbar, sich mit den Methoden des wissenschaftlichen Arbeitens
vertraut zu machen, um die Ergebnisse wissenschaftlicher Studien im Hinblick auf ihre Qualität, d.h. ihre
Aussagekraft, ihre Generalisierbarkeit auch über die Situation hinaus, in der sie durchgeführt wurde,
beurteilen zu können. Wichtige Impulse hierzu sind in den letzten Jahren unter dem Stichwort
„evidenzbasierte Medizin“ (EBM) entstanden. Mit Evidenzbasierung ist gemeint, das eigene ärztliche
Handeln so weit wie möglich mittels wissenschaftlicher Erkenntnisse („Evidenz“) abzusichern. Was wie
eine Selbstverständlichkeit klingt, ist es keineswegs. Ganz im Gegenteil fehlen in vielen, selbst ganz
zentralen Bereichen der Medizin bis heute wissenschaftliche Nachweise darüber, dass bestimmte medizinische Maßnahmen tatsächlich wirksam sind, ja, dass sie überhaupt einen Nutzen haben und nicht vielmehr Schaden anrichten. In vielen Fällen folgen etwa therapeutische Maßnahmen einer rationalen,
nachvollziehbaren und plausiblen Rationale (z.B. auf der Grundlage spezifischer Vorstellungen darüber,
wie eine bestimmte Störung oder Krankheit im Körper entstanden ist). Allerdings kann nur eine direkte
Überprüfung dieser Maßnahmen die vermutete Wirksamkeit auch wirklich beweisen, weil aufgrund der
Komplexität des menschlichen Organismus und der Vielfalt der möglichen Variablen, die auf Krankheitsund Gesundheitsprozesse Einfluss nehmen, einfache Ursache-Wirkungs-Beziehungen nur in den seltensten Fällen hinreichende Erklärungskraft haben (vgl. dazu auch die Vorlesungen über die Konzepte von
Gesundheit und Krankheit aus dem ersten Semester). Diese Vorlesung kann nur einen ersten Überblick
über die wichtigsten Anforderungen und Voraussetzungen solcher Studien geben, entsprechende Publikationen werden zur Vertiefung daher ausdrücklich empfohlen (siehe Literaturhinweise am Ende).
Zu welchem Zweck machen wir überhaupt wissenschaftliche Studien? Gerade in der Psychologie kann
leicht der Eindruck entstehen, dass wissenschaftliche Studien eigentlich nur das bestätigen, was uns aus
dem Alltag schon längst vertraut ist. Was also ist der Unterschied zwischen dem Wissen aus Alltagserfahrungen und dem Wissen, das wir aus wissenschaftlichen Studien gewinnen? Ein wichtiger Unterschied
ist die Verlässlichkeit der Erkenntnisse, die zwar auch bei einer wissenschaftlichen Studie niemals absolut
sein kann, die aber in der Regel wesentlich größer ist, als unter unkontrollierten Alltagsbedingungen.
Bereits unsere subjektive Wahrnehmung unterliegt nämlich bestimmten Störeinflüssen, die das darauf
gründende Urteil beeinflussen, wie leicht an optischen Täuschungen zu zeigen ist: Vielen Personen erscheint beispielsweise der mittlere Kreis der linken Abbildung in Folie 1 kleiner als der mittlere Kreis der
rechten Abbildung, obwohl sie in Wirklichkeit beide gleich groß sind. Der jeweils andere Kontext (große
© Dr. Götz Fabry, Abteilung für Medizinische Psychologie, Freiburg. www.medizinische-psychologie.de
1 / 13
kreise vs. Kleine Kreise) führt uns hier in die Irre. Ein ähnliches Phänomen zeigt Folie 2: Hier erscheint
der graue Balken in der Mitte im rechten Teil dunkler als im linken. In Wirklichkeit ist aber der Helligkeit
durchgehend dieselbe, erneut erzeugt der Kontrast mit dem Umfeld diesen Effekt.
Folie 1
Wahrnehmungsphänomene
Folie 2
Wahrnehmungsphänomene
Aber nicht nur solche einfachen Täuschungen beeinflussen unser Urteil wie das auf den folgenden Folien
dargestellte Experiment verdeutlicht: Den Testpersonen wurden hier zunächst Kurzbiographien von drei
Personen vorgelegt, anschließend wurde sie gebeten, deren Vertrauenswürdigkeit zu beurteilen (Folie
3). Erwartungsgemäß beurteilten Sie die Vertrauenswürdigkeit von Christopher Thompson am höchsten.
Anschließend nahmen die Versuchspersonen an mehreren Spielrunden teil, bei denen sie jedes Mal entscheiden mussten, ob sie der jeweils gezeigten Person, 1$ geben würden. Ihr „Gegenüber“ erhielte dann
zusätzliches Geld, so dass er insgesamt 3$ habe, die er wiederum mit der Testperson teilen könne, so
dass jeder 1,5$ habe, oder für sich behalten könne (Folie 4). Wie Folie 5 zeigt, entschiedenen sich die
Testpersonen erwartungsgemäß bei Christopher Thompson häufiger als bei den anderen beiden Personen dafür, ihm Geld zu geben, wohl in der Erwartung, er werde aufgrund seiner größeren Vertrauenswürdigkeit, seinen Gewinn dann mit ihnen teilen. Das Spiel war allerdings so organisiert, dass sich die
Häufigkeit, mit der die fiktiven Personen tatsächlich ihr Geld teilten, nicht unterschied. Das heißt, die
Versuchspersonen erhielten von Christopher Thompson genauso häufig Geld zurück wie von Alex Tudor
und Thomas Sweeney. Entsprechend veränderte sich auch die Einschätzung der Vertrauenswürdigkeit
(Folie 6 linke Grafik) und zwar insbesondere bei Christopher Thompson, den die Versuchspersonen
nach mehreren Spielrunden im Vergleich zu vor dem Spiel als weniger vertrauenswürdig einschätzten.
Interessant ist jetzt aber der Vergleich dieses Wissens mit den tatsächlich getroffenen Entscheidungen in
frühen Spielrunden und späten Spielrunden (in denen die Versuchsteilnehmer also schon Erfahrungen
© Dr. Götz Fabry, Abteilung für Medizinische Psychologie, Freiburg. www.medizinische-psychologie.de
2 / 13
mit dem tatsächlichen „Verhalten“ von Christopher Thompson gemacht hatten): Hier zeigt sich nämlich,
dass der Vertrauensvorschuss für Christopher Thompson auch dann noch erhalten bleibt, wenn die Versuchspersonen eigentlich längst gegenteilige Erfahrungen gemacht haben (Folie 6 rechte Grafik)!
Daraus könnte man den Schluss ziehen, dass selbst gegenteilige Erfahrungen nicht unbedingt zur Revision einer vorgefassten Meinung führen.
Folie 3
Wahrnehmung von Vertrauenswürdigkeit
Christopher Thompson
hat einer Frau bei
einem Brand in einer
Disco das Leben
gerettet
Alex Tudor,
verhaftet beim Versuch,
Kacheln vom Hitzeschild
der Columbia bei Ebay
zu versteigern
Thomas Sweeney
entging um
Haaresbreite einem
Flugzeugabsturz (kam
zu spät zum Check-in)
„Was glauben Sie:
Wie vertrauenswürdig ist diese
Person?“
C
T
A
T
T
S
(Delgado et al. 2005)
Folie 4
Vertrauenswürdigkeit und
Entscheidungen
Alex Tudor
Christopher Thompson
1$ geben
erhält 3$
?
Thomas Sweeney
teilt 3$
Gewinn: 1,5$
behält 3$
Verlust: 1$
1$ behalten
Gewinn: 1$
(Delgado et al. 2005)
Folie 5
Vertrauenswürdigkeit &
Entscheidungen
Alex Tudor
Christopher Thompson
Thomas Sweeney
p<.05
p=.18
p=.96
CT
AT
TS
Art der
Entscheidungen
%-Verhältnis
(Delgado et al. 2005)
© Dr. Götz Fabry, Abteilung für Medizinische Psychologie, Freiburg. www.medizinische-psychologie.de
3 / 13
Folie 6
Vertrauenswürdigkeit & Erfahrung
Alex Tudor
Christopher Thompson
Vertrauenswürdigkeit prä/post
F2,22=11.78, p<.0001
Thomas Sweeney
Entscheidungen,
Geld zu geben (%-Verhältnis)
*
*
(Delgado et al. 2005)
Es gibt aber noch weitere Gründe, warum wir gegenüber Alltagsbeobachtungen gegenüber misstrauisch
sein müssen. Denn nicht nur in unserem Urteil sind wir leicht beeinflussbar, auch in unserem Verhalten.
Folie 7 zeigt anhand einer klinischen Studie den Einfluss des sogenannten Hawthorne-Effekts (auch
Versuchspersonen-Effekt): Die sogenannten Beta-Blocker sind Medikamente zur Behandlung des Bluthochdrucks. Eine häufige und für Patienten sehr unangenehme Nebenwirkungen sind Erektionsstörungen, wobei umstritten ist, in wieweit sich diese tatsächlich auf die Substanz zurückführen lassen, dennoch werden sie im Beipackzettel erwähnt. In dieser Studie wurden nun drei Gruppen von Männern untersucht, bei denen kürzlich ein Bluthochdruck diagnostiziert worden war und die daher mit einem BetaBlocker (Metoprolol) behandelt werden sollten. Die Gruppen erhielten die gleiche Dosierung des Medikaments aber jeweils unterschiedliche Informationen: Der ersten Gruppe wurde gesagt, mit welcher
Substanz sie behandelt wurde, mögliche Nebenwirkungen einschließlich der Erektionsstörungen wurden
erwähnt. Die zweite Gruppe erhielt ebenfalls die Information über die Substanz und deren Nebenwirkungen, allerdings wurden die Erektionsstörungen nicht erwähnt. Die dritte Gruppe erhielt keine Informationen über die Substanz, sondern nur über die Nebenwirkungen, wobei ebenfalls die Erektionsstörungen
unerwähnt blieben. Nach sechs Wochen Behandlungsdauer wurden die Patienten zu Nebenwirkungen
befragt. Die Häufigkeit, mit der Erektionsstörungen aufgetreten waren, unterschied sich dabei signifikant
zwischen den Gruppen (siehe Folie). In einem zweiten Schritt wurden dann diejenigen mit den Erektionsstörungen zusätzlich entweder mit einem Placebo-Präparat oder mit Tadalafil (Vergleichbar „Viagra“)
behandelt, ohne dass die Patienten wussten, welche Substanz sie tatsächlich erhielten. Wie die Zahlen
auf der Folie zeigen, gab es keine Unterschiede im Hinblick auf die Wirksamkeit.
Folie 7
Hawthorne-Effekt
Bsp.: erektile Dysfunktion (ED) bei β-Blocker
Metoprolol
Potentielle NW: ED
ED
Tadalafil
Placebo
Gruppe 1 (N=38 m):
Info über Substanz + NW + ED
32%
20,7%
21,1%
Gruppe 2 (N=38 m):
Info über Substanz + NW
13%
21,7%
22,2%
8%
21,7%
22,0%
Gruppe 3 (N=38 m):
Info über NW
Weiterbehandlung der Pat.
mit ED (randomisiert)
Cocco 2008
© Dr. Götz Fabry, Abteilung für Medizinische Psychologie, Freiburg. www.medizinische-psychologie.de
4 / 13
Welche Schlüsse lassen sich aus dieser Studie ziehen? Für unseren Zusammenhang am wichtigsten ist
die Erkenntnis, dass das Wissen über einen bestimmten erwarteten Effekt offensichtlich in der Lage ist,
genau diesen hervorzurufen, was für eine wissenschaftliche Untersuchung natürlich problematisch ist
und daher entsprechende Gegenmaßnahmen erforderlich macht. Dass solche Beeinflussungen nicht nur
die Versuchspersonen betreffen können, sondern auch die Wissenschaftler, die den Versuch planen und
durchführen, zeigt der auf Folie 8 dargestellte Rosenthal-Effekt (auch Versuchsleiter-Effekt). In der
von Rosenthal durchgeführten Studie wurde untersucht, wie schnell Ratten lernen, Reize zu unterscheiden, zumindest wurde das den Wissenschaftlern gesagt, welche die Versuche durchführen sollten. In
Wirklichkeit wollte man aber die Wissenschaftler selbst untersuchen. Einer Gruppe wurde nämlich gesagt, ihre Ratten seien besonders schlau und lernfähig, der anderen Gruppe wurde gesagt, ihre Ratten
seien eher dumm und lernunfähig. Tatsächlich gab es aber keine solchen Unterschiede zwischen den
Versuchstieren. Interessanterweise schlugen sich die Annahmen der Versuchsleiter über die Fähigkeiten
ihrer Tiere aber dennoch in den Ergebnissen nieder: Die „schlauen“ Ratten lernten tatsächlich schneller
als die „dummen“ Ratten. Unbewusst hatten die Wissenschaftler also durch ihre Annahmen und ihr Verhalten die Versuchstiere so beeinflusst, dass diese den jeweiligen Erwartungen gerecht wurden! Natürlich treten solche Effekte nicht nur in Tierversuchen auf, sondern sind ein ganz fundamentales Problem
jeglicher Forschung und müssen ebenfalls sehr sorgfältig kontrolliert werden, damit verlässliche Daten
erhoben werden können.
Folie 8
Rosenthal-Effekt
Zahl richtiger
Reaktionen
4
„kluge“ Ratten
3
2
„dumme“ Ratten
1
0
1
2
3
4
5
Versuchstage
Rosenthal & Fode 1963
Eine letzte Fehlerquelle, die ebenfalls im Alltag eine wichtige Rolles spielt, betrifft die Interpretation von
Ereignissen (Folie 9).
Folie 9
Logisch?
„Die Zahl der Störche in Europa ist rückläufig.“
„Die Zahl der Geburten in Europa ist ebenfalls rückläufig.“
„Die Störche sind also für den Geburtenrückgang
verantwortlich.“
„Herr Meier hat Rückenschmerzen.“
„Herr Meier hat einen Bandscheibenvorfall.“
„Der Bandscheibenvorfall ist also für die Rückenschmerzen
von Herrn Meier verantwortlich.“
 Das gleichzeitige Auftreten von Ereignissen ergibt noch
keinen Grund (sondern allenfalls eine Hypothese)
© Dr. Götz Fabry, Abteilung für Medizinische Psychologie, Freiburg. www.medizinische-psychologie.de
5 / 13
Gleichzeitig auftretende Ereignissen legen häufig eine kausale Interpretation nahe, die allerdings keineswegs auch wirklich zutreffen muss. Vielmehr lässt sich daraus zunächst nur eine Hypothese ableiten,
die mit geeigneten Methoden geprüft werden muss. Wie aber insbesondere das zweite Beispiel zeigt,
können solche voreiligen Schlüsse sehr plausibel und daher besonders gefährlich sein, weil sie eine falsche Sicherheit erzeugen. Folie 10 fasst die beschriebenen Beobachtungsfehler zusammen. Außer
den hier diskutierten Beispielen gibt es natürlich noch sehr viel mehr solcher Fehlerquellen, über die die
gängigen Lehrbücher informieren. (Auch wenn hier von „Fehlern“ die Rede ist, sollte man natürlich berücksichtigen, dass unsere Neigung, Informationen nicht „neutral“ zu verarbeiten, sondern vor dem Hintergrund unserer Erfahrungen zu interpretieren und daraus Hypothesen abzuleiten, die wir unserem
Denken und Handeln zugrunde legen, uns in vielen Fällen die Bewältigung unseres Alltags extrem erleichtert.)
Folie 10
Beobachtungsfehler
• Kontrastfehler: im direkten Vergleich werden Unterschiede
übertrieben wahrgenommen
• Halo-Effekt (Halo = Heiligenschein): der erste Eindruck lässt
sich nur schwer korrigieren
• Hawthorne- (Versuchspersonen-) Effekt: erkannte
Beobachtung führt zu verändertem Verhalten (Reaktivität)
• Rosenthal- (Versuchsleiter-) Effekt: Erwartung eines
bestimmten Ergebnisses führt zu entsprechendem Verhalten bei
der Versuchsperson
• Logischer Fehler: vermutete Zusammenhänge verleiten zu
voreiligen Schlüssen
• usw…
Aus den bisher geschilderten Problemen wird deutlich, dass zuverlässige Daten und Erkenntnisse nur mit
einigem Aufwand zu haben sind. Welche Schritte dazu im Einzelnen notwendig sind wird überblicksartig
in den folgenden Abschnitten dargestellt. Wie gesagt: Zu jedem dieser Schritte sind vielfältige Überlegungen anzustellen, die den Rahmen dieser Vorlesung bei weitem sprengen. Hier kann daher nur ein
kurzer Überblick gegeben werden, von dem aus weitere Vertiefungen mithilfe der Lehrbücher absolut
notwendig sind.
Folie 11 gibt einen Überblick über die Schritte, die bei der Durchführung einer wissenschaftlichen Untersuchung notwendig sind und die im Folgenden ausführlicher erläutert werden. Die Schritte 6 bis 9
werden Gegenstand der nächsten Vorlesung sein.
Folie 11
Ablauf einer wissenschaftlichen
Untersuchung
1. Ausgangspunkt: Alltagsbeobachtung, Vermutung, Theorie
2. Wissenschaftliche Fragestellung
3. Hypothesenbildung
4. Operationalisierung
5. Untersuchungskriterien
6. Untersuchungsplanung
7. Datengewinnung
8. Datenauswertung und –Interpretation
9. Ergebnisbewertung
© Dr. Götz Fabry, Abteilung für Medizinische Psychologie, Freiburg. www.medizinische-psychologie.de
6 / 13
Ausgangspunkt wissenschaftlicher Studien in der Medizin und Psychologie sind häufig Alltagsbeobachtungen, wie sie beispielhaft in Folie 12 dargestellt sind. Typisch für solche Bebachtungen ist, dass sie
noch unscharf sind, was sich in der Formulierung z.B. an wenig spezifischen Wörtern wie „irgendwie“
ablesen lässt.
Folie 12
1. Alltagsbeobachtungen
„Patienten mit
Rückenschmerzen
haben zu viel
Stress.“
„Depressive Patienten
haben zu hohe
Ansprüche an sich.“
„Leute die rauchen
sind irgendwie auch
kommunikativer.“
Ein wichtiger Schritt auf dem Weg zu wissenschaftlichen Erkenntnissen besteht also darin, aus diesen
Alltagsbeobachtungen eine wissenschaftliche Fragestellung abzuleiten (Folie 13). Diese zeichnet
sich nicht nur durch eine größere Genauigkeit in der Formulierung aus, sondern auch durch Bezugnahme
auf Theorien und Konstrukte (Folie 14), die es erlauben, die zu untersuchenden Sachverhalte noch
konkreter zu fassen.
Folie 13
2. Wissenschaftliche Fragestellung
• „Unterscheiden sich Patienten mit einer depressiven
Störung im Hinblick auf ihren Perfektionismus von
Patienten mit anderen psychischen Störungen?“
• „Gibt es einen Zusammenhang zwischen vermehrtem
Stress und Rückenschmerzen?“
• „Unterscheiden sich Raucher im Hinblick auf ihre
soziale Kompetenz von Nichtrauchern?“
Aus dem im ersten Beispiel von Folie 12 angeführten „ganz genau machen“ wurde in der wissenschaftlichen Fragestellung „Perfektionismus“, ein psychologisches Konstrukt, zu dem bereits eine ganze Reihe
von wissenschaftlichen Erkenntnissen vorliegen, auf die bei einer neuen Studie Bezug genommen werden kann. Auch die Patienten wurden genauer definiert, in dem von „depressiver Störung“ die Rede ist,
womit auf die im klinischen Kontext übliche Diagnosen Bezug genommen wird, die mit Hilfe eines Klassifikationssystems (der International Classification of Diseases, ICD) der Weltgesundheitsorganisation
eindeutig beschrieben werden kann. Man muss sich allerdings bewusst machen, dass die größere Eindeutigkeit und Genauigkeit der Formulierung mit einer Reduktion der in der Alltagsbeobachtung noch
möglichen Bedeutungen verbunden ist. „Perfektionismus“ als psychologisches Konstrukt unterscheidet
sich von dem, was wir im Alltag unter „hohen Ansprüchen“ verstehen. Diese Einschränkung ist insofern
wichtig, als damit die Übertragbarkeit der Ergebnisse einer Studie in den Alltag begrenzt sein kann,
© Dr. Götz Fabry, Abteilung für Medizinische Psychologie, Freiburg. www.medizinische-psychologie.de
7 / 13
wenn sich nämlich die verwendeten Konstrukte zu sehr von dem unterscheiden, was wir in unserem
vorwissenschaftlichen Alltags-Verständnis damit verbinden. Gerade bei (neuro-)psychologischen Studien
lässt sich häufig beobachten, dass die dort unter eng definierten experimentellen Bedingungen gewonnenen Erkenntnisse unkritisch generalisiert werden, ohne die Unterschiede zwischen Alltagsbegriffen und
wissenschaftlichen Konstrukten zu berücksichtigen.
Folie 14
Theorien & Konstrukte
• Theorie: beschreibt die Phänomene eines
Sachverhalts, ermöglicht Erklärungen,
Gesetzmäßigkeiten und Prognosen
Bsp.: Salutogenese, Rubikon-Modell, transaktionales
Stressmodell, etc.
• Konstrukt: theoretisches Konzept, Baustein der
Theorie, nicht direkt beobachtbar, wird aus
Indikatoren erschlossen
Bsp.: Kohärenzgefühl, Motivation, Volition, Coping,
Abwehr, Intelligenz, etc.
Aus der Fragestellung lassen sich in einem nächsten Schritt Hypothesen ableiten, die dann mit Hilfe
der wissenschaftlichen Studie überprüft werden können (Folie 15). Damit ist zugleich ihr wichtigstes
Charakteristikum benannt, nämlich die prinzipielle Überprüfbarkeit mit Hilfe geeigneter Methoden.
Es ist durchaus möglich, dass solche Methoden noch nicht existieren und erst entwickelt werden müssen, daher gibt es wissenschaftliche Hypothesen, die noch nicht überprüft sind, was aber prinzipiell möglich wäre.
Folie 15
3. Hypothesenbildung
• Hypothesen...
– behaupten eine Beziehung zwischen mindestens zwei
Variablen
– müssen empirisch und intersubjektiv überprüfbar sein
Bsp.:
• „Patienten mit einer depressiven Störung haben einen stärker
ausgeprägten Perfektionismus.“
• „Vermehrter Stress führt bei Patienten mit Rückenschmerzen zu
stärkerem Schmerzempfinden.“
• „Personen mit vermehrtem Stress haben ein höheres Risiko für
Rückenschmerzen.“
Wichtig ist in diesem Zusammenhang die Unterscheidung zwischen deterministischen Hypothesen und
probabilistischen Hypothesen (Folie 16). Während eine deterministische Hypothese (unter bestimmten Bedingungen) auf alle Fälle zutrifft, macht die probabilistische Hypothese eine Aussage zur
Wahrscheinlichkeit (etwa des Eintretens eines bestimmten Ereignisses). Hypothesen in der Psychologie
und Medizin sind fast immer probabilistisch. Wir wissen z.B. dass bestimmte Risikofaktoren die Wahrscheinlichkeit erhöhen, eine bestimmte Krankheit zu entwickeln oder umgekehrt, dass bestimmte Ressourcen zu einer erhöhten Widerstandsfähigkeit gegen potentielle Stressoren führen. Was wir allerdings
nicht wissen ist, ob und wie sich z.B. eine Krankheit bei einem individuellen Patienten entwickeln wird,
wie er auf eine bestimmte Behandlung ansprechen wird, wie lange er noch leben wird, usw.
© Dr. Götz Fabry, Abteilung für Medizinische Psychologie, Freiburg. www.medizinische-psychologie.de
8 / 13
Folie 16
Hypothesen
• Deterministisch: trifft für alle Fälle zu
Bsp.: Ein Stein fällt zu Boden, wenn man ihn loslässt.
• Probabilistisch: Aussage zu Wahrscheinlichkeit
Bsp.: Bei Vorliegen einer Hypertonie ist das Risiko
eines Herzinfarkts erhöht.
In Medizin und Psychologie sind Hypothesen (fast)
immer probabilistisch. Sichere Aussagen über
einzelne Individuen sind daher nicht möglich!
Sind Hypothesen für die wissenschaftliche Studie formuliert, muss im nächsten Schritt festgelegt werden, wie die in der Hypothese enthaltenen Variablen gemessen werden sollen. Diese „Messbarmachung“ bezeichnet man als Operationalisierung (Folie 17). Für die in Folie 12 genannten Beispiele
könnte das z.B. heißen, dass man einen Fragebogen auswählt, mit dem der Schweregrad einer Depression gemessen werden kann. Das hier als Beispiel ausgewählte Beck-Depressions-Inventar ist ein Fragebogen, der vom Patienten selbst ausgefüllt wird (Selbstbeurteilung). Es gibt aber auch Fragebögen,
die von einem Beobachter, etwa einem Arzt ausgefüllt werden (Fremdbeurteilung, für die Depression
z.B. die Hamilton-Skala). Ob ein Verfahren der Selbst- oder Fremdbeurteilung zum Einsatz kommen soll,
hängt von der Fragestellung ab, die mit der wissenschaftlichen Studie verfolgt wird und muss von den
jeweiligen Forschern entschieden werden.
Folie 17
4. Operationalisierung
• Angabe des Messverfahrens:
– z.B. Depressive Störung: ICD-10, zusätzlich
Fragebogen (z.B. Beck-Depressions-Inventar)
– Perfektionismus: mehrdimensionale
Perfektionismusskala (Frost)
– Rückenschmerzen: Visuelle Analogskala
– Rauchen: Zahl der Zigaretten/Tag, Dauer,
Inhalationstiefe, etc.
Von entscheidender Bedeutung im Hinblick auf die eingesetzten Messverfahren ist die Qualität der damit
erhobenen Daten. Folie 18 zeigt die wichtigsten Gütekriterien, die in diesem Zusammenhang erfüllt sein
müssen. Am einfachsten zu verstehen ist die Objektivität. Damit ist gemeint, dass es keinen Unterschied machen darf, von wem die Daten erhoben und ausgewertet werden, das Ergebnis muss immer
dasselbe sein. Die Objektivität ist z.B. dann ein Problem, wenn die Datenerhebung wenig strukturiert
erfolgt, z.B. bei einem nicht-standardisierten Interview oder bei direkter Beobachtung. Bei strukturierten
Verfahren, z.B. einem Fragebogen mit vorgegebenen und lediglich auszuwählenden Antworten, der elektronisch ausgewertet wird, ist die Objektivität dagegen meist unproblematisch.
© Dr. Götz Fabry, Abteilung für Medizinische Psychologie, Freiburg. www.medizinische-psychologie.de
9 / 13
Folie 18
5. Untersuchungskriterien
• Objektivität: Unabhängigkeit von der Person des
Untersuchers
• Reliabilität: Zuverlässigkeit, v.a. Reproduzierbarkeit
• Validität: Gültigkeit, inhaltliche Bedeutung
Das zweite wichtige Kriterium ist die Reliabilität, also die Zuverlässigkeit der Daten. Am einfachsten
lässt sich das durch eine Wiederholung der Messung überprüfen. Vorausgesetzt das zu messende Merkmal ist zeitlich stabil, dann sollte eine wiederholte Messung jedes Mal zu identischen Ergebnissen führen.
Folie 19 verdeutlicht diese Zusammenhänge am Beispiel einer Prüfung (auf den Achsen sind die jeweils
erreichten Punktwerte eingetragen, der Mittelwert lag hier bei 500 Punkten): Im Idealfall würde ein Student im Wiederholungsfall dieselbe Punktzahl erreichen wie beim ersten Mal, vorausgesetzt, sein Wissen
hätte sich in der Zwischenzeit nicht verändert. Die Punktwolke würde sich dann einer Linie annähern.
Folie 19
Reliabilität
Konsistenz von Testergebnissen
Scatterplots zweier paralleler Testformen bei verschiedenen Reliabilitätsnivaus.
je 0.40
je 0.85
je 0.90
Wainer & Thissen 1996
Die Reliabilität wird normalerweise durch einen Korrelationsquotienten angegeben. Für eine gute
Prüfung (bzw. einen guten Test) wird im Allgemeinen erst ein Quotient von 0.8, besser noch 0.9 als ausreichend angesehen, viele Prüfungen erreichen aber nur niedrigere Werte. Was das konkret bedeuten
kann, zeigt Folie 20. Am Beispiel zweier Klausuren (die ja im Grunde genommen nichts anderes als ein
psychologisches Testverfahren sind) mit je 20 Fragen ist dargestellt, wie viele von 250 Studenten bei
unterschiedlichen Reliabilitätswerten dieselbe oder eine andere Note erreichen würden. Man sieht, dass
es selbst bei einer relativ hohen Reliabilität von 0.9 immer noch bei einigen Studierenden zu einer Abweichung von einer Note kommt. Bei geringeren Reliabilitätswerten, wie sie durchaus vorkommen, sind
die Abweichungen noch größer. Dieses Beispiel macht deutlich, wie sehr die Aussagekraft eines Testverfahrens von seiner Reliabilität abhängt.
© Dr. Götz Fabry, Abteilung für Medizinische Psychologie, Freiburg. www.medizinische-psychologie.de
10 / 13
Folie 20
Reliabilität (Zuverlässigkeit)
am Beispiel Prüfungen
r=0.5
r=0.8
r=0.9
mit gleicher Note
84
123
152
mit Unterschied ±1 Note
114
112
95
mit Unterschied ±2 Noten
43
15
3
mit Unterschied ±3 Noten
8
0
0
mit Unterschied ±4 Noten
8
0
0
Anzahl Studenten…
Klausur mit 2 x 20 Fragen, 250 Studierende
Möltner et al. 2006
Da die zeitliche Stabilität bei vielen Merkmalen nicht gegeben ist und wiederholte Messungen zudem
meist nur wenig praktikabel sind, wird die Reliabilität in der Praxis meist nicht durch die Wiederholung
eines Tests bestimmt, sondern dadurch, dass man z.B. die einzelnen Fragen („Items“) eines Fragebogens zufällig auf zwei Hälften verteilt und überprüft, inwieweit die Ergebnisse dieser beiden Teiltests
miteinander übereinstimmen (sog. Split-Half Reliabilität). So könnte man sich das Beispiel von Folie 20
auch als eine einzige Klausur denken, die aus zwei Teilen mit je 20 Fragen besteht. Werden die Fragen
zufällig auf diese beiden Teile verteilt, dann sollten bei einer hohen Reliabilität die Ergebnisse der beiden
Teile gut miteinander übereinstimmen.
Das dritte und wichtigste Gütekriterium ist die Validität, also die Gültigkeit. Hier geht es darum, ob
ein Messverfahren tatsächlich misst, was es zu messen vorgibt. So würde man etwa erwarten, dass Personen, die auf der oben genannten Beck-Depressions-Skala hohe Werte erreichen, tatsächlich auch
schwerer depressiv sind, als Personen mit niedrigeren Werten. Um das zu überprüfen könnte z.B. das
klinische Urteil erfahrener Ärzte herangezogen werden. Die auf diese Weise bestimmte Validität wird als
Kriteriumsvalidität bezeichnet, weil ein anderes Kriterium (in diesem Fall das Urteil der Ärzte) herangezogen wird, um die Gültigkeit der Ergebnisse zu überprüfen (Folie 21).
Folie 21
Validität (Gültigkeit)
• Inhaltsvalidität: Items / Aufgaben bilden das zu messende
Merkmal eindeutig ab
Problem: Der Augenschein kann täuschen!
• Kriteriumsvalidität: Übereinstimmung von Testergebnis und
spezifischen Kriterien (Variablen)
z.B.: Abiturnote und Studienergebnisse
Problem: eindeutige Kriterien nicht immer verfügbar!
• Konstruktvalidität: Bestätigung möglichst vieler Hypothesen
über das Merkmal
z.B. Unterschiede zwischen bestimmten Patientengruppen, zeitliche
Stabilität, Zusammenhang/Abgrenzung zu anderen Konstrukten
Problem: anhaltender Prozess!
Ein anderes Beispiel wäre z.B. die Staatsexamensprüfung in Medizin, von der man vielleicht verlangen
müsste, dass sie eine Aussage über die klinische Kompetenz eines Absolventen macht. Da allerdings
nicht immer geeignete Kriterien zur Verfügung stehen, gibt es auch noch andere Möglichkeiten, die Validität zu bestimmen. Am häufigsten wird die Inhaltsvalidität eines Verfahrens festgestellt. Das bedeutet letztendlich nichts anderes, als das es für einen Experten offensichtlich ist, dass die Inhalte eines
Testverfahrens für das zu messende Merkmal repräsentativ sind. So würde man z.B. ohne weiteres da© Dr. Götz Fabry, Abteilung für Medizinische Psychologie, Freiburg. www.medizinische-psychologie.de
11 / 13
von ausgehen, dass die praktische Führerscheinprüfung valide Ergebnisse hervorbringt, weil die Aufgaben, die dort zu bewältigen sind unmittelbar abbilden, was von einem Autofahrer im Straßenverkehr
verlangt wird. Allerdings stellt sich immer wieder heraus, dass solche offensichtlichen inhaltlichen Beziehungen zwischen dem Testverfahren und dem zu messenden Merkmal dennoch keine Garantie dafür
sind, dass wirklich valide Ergebnisse herauskommen. Die Inhaltsvalidität wird daher häufig auch als Augenscheinvalidität bezeichnet, wobei der Augenschein bekanntlich auch täuschen kann. Eine dritte
Form von Validität ist die Konstruktvalidität. Damit ist gemeint, dass die mit einem Verfahren gemessenen Ergebnisse möglichst viele Hypothesen bestätigen bzw. widerlegen können, die auf das zu messende Merkmal bezogen sind. Bei manchen Merkmalen würde man z.B. Unterschiede zwischen bestimmten Altersgruppen erwarten oder zwischen den Geschlechtern. Wichtig ist in diesem Zusammenhang
auch, ob eine ausreichende Abgrenzung von anderen Konstrukten gelingt (ob z.B. ein angeblicher Intelligenztest nicht in Wirklichkeit Motivation misst). Diese Überlegungen zeigen, dass die Validität eine echte Herausforderung für viele Messverfahren ist. Dies gilt umso mehr, als die drei Gütekriterien hierarchisch aufeinander bezogen sind. Daten können demnach nur dann valide sein, wenn sie auch objektiv
und reliabel sind. Umgekehrt sind dagegen Objektivität und Reliabilität noch keine hinreichenden Bedingungen für Validität. Die in Folie 22 dargestellten Schießscheiben von drei unterschiedlichen Schützen
verdeutlichen diesen Zusammenhang.
Folie 22
5. Untersuchungskriterien
• Objektivität: Unabhängigkeit von der Person des
Untersuchers
• Reliabilität: Zuverlässigkeit, v.a. Reproduzierbarkeit
• Validität: Gültigkeit, inhaltliche Bedeutung
weder reliabel
noch valide
reliabel
aber nicht valide
reliabel
und valide
Folie 23
Take-home message
• Wahrnehmungen & Beobachtungen sind anfällig für
Verzerrungen
• Wissen über Ziel und Zweck einer Beobachtung
verfälscht Ergebnis
• wichtige Elemente wissenschaftlicher
Untersuchungen:
– Theorie
– Hypothesen
– Operationalisierung
– Gütekriterien der Messung
© Dr. Götz Fabry, Abteilung für Medizinische Psychologie, Freiburg. www.medizinische-psychologie.de
12 / 13
Literaturhinweise (siehe auch CampusOnline!):
-
Methodenkapitel der einschlägigen Lehrbücher (mindestens!): z.B. Faller/Lang, Buser/KaulHecker, etc.
-
Kunz R, Ollenschläger G, Raspe H, Jonitz G, Donner-Banzhoff (Hg) Lehrbuch Evidenzbasierte Medizin in Klinik und Praxis. Köln (Deutscher Ärzte-Verlag), 22007.
-
Jürgen Kaube: Wissensgesellschaft Die drei Formen der Ignoranz. Artikel aus der Frankfurter Allgemeinen Zeitung vom (28.10.2010): Wenn geschrieben wird, ohne zu lesen: Der amerikanische
Soziologe Andrew Abbott hat untersucht, wie die Wissensgesellschaft den Erwerb von Wissen
vernachlässigt - und dadurch die Idiotie befördert.
http://www.faz.net/aktuell/feuilleton/forschung-und-lehre/wissensgesellschaft-die-drei-formender-ignoranz-1575750.html
-
Wieland W (2002): The character and mission of the practical sciences, as exemplified by medicine. Poiesis & Praxis: International Journal of Technology Assessment and Ethics of Science, 2:
123-134.
© Dr. Götz Fabry, Abteilung für Medizinische Psychologie, Freiburg. www.medizinische-psychologie.de
13 / 13
Document
Kategorie
Seele and Geist
Seitenansichten
21
Dateigröße
467 KB
Tags
1/--Seiten
melden