Versuchsdesign und Randomisation - ein Nutzerhandbuch

Versuchsdesign und Randomisation

Nutzerhandbuch für das Verfahren ‚DESIGN‘ als Softwarelösung unter PIAFStat

Gliederung

  1. Zusammenfassung
  2. Ziele
  3. Einführung
  4. Aufgabenteilung
  5. Prophy­lak­tische Berücksichtigung typischer Fehlerquellen durch das Verfahren ‚DESIGN‘
  6. Nutzeroberfläche, Optionen und optionale Blocks
  7. Versuchsdesigns mit unterschiedlich komplexe Vorgaben

...

  1. Einheit von Design und Auswertung

 Auszüge:

aus 1. Zusammenfassung

Im Rahmen der Pflege und Weiterentwicklung der Softwarelösung der Länder und des Bundes für das Feldversuchswesen PIAF wurde die Softwarelösung DESIGN erstellt, die die Anwender in der methodischen Versuchsplanung, insbesondere der Optimierung des Versuchsdesigns und in der Bereitstellung von Randomisationsplänen effizient unterstützt. Die Gesamt­konzipie­rung und Koordinierung lag bei der LFA MV, SG Sortenwesen und Biostatistik. Wissen­schaftlichen Grundlagen wurden in Kooperation zwischen der Universität  Hohenheim, der LFA MV und der Universität Canberra (Australien) erarbeitet und veröffentlicht. Die Fa. BioMath (Rostock) übernahm Auftragsleistungen zur Erstellung von SAS®-Makros - die Finanzierung dieser Teilleistungen erfolgt durch Mittel der Bund-Länder-Gemeinschaft PIAF.

Das Verfahren DESIGN unterstützt Versuchsansteller im angewandten Versuchswesen nutzer­freundlich, effizient und auf aktuellstem wissenschaftlichem wie ebenso praktischem Niveau. Die LFA stellt den PIAF-Anwendern in MV und in den anderen Bundesländern sowie in Bundes­einrichtungen die Software DESIGN und mit diesem Abschlussbericht ein Nutzerhand­buch zur Verfügung.

Die Nutzeroptionen werden in Abschnitt 6 vorgestellt und erläutert. Im Abschnitt 7 werden zunächst die Zielkriterien für gegenüber verschiedensten Störungsarten robuste Versuchs-designs definiert. Nachfolgend wird - beginnend mit simplen und dann zunehmend komplexen Designs - die Wirksamkeit von Designvorgaben für die Verbesserung der Zielkriterien aufge­zeigt. Die möglichen Kombinationen von Designvorgaben sind sehr vielfältig, sie gehen weit über die bisher verbreiteten ‚Anlagemethoden‘ (wie einfaktorielle Blockanlage, Lateinisches Rechteck, Alpha-Gitter ...) hinaus. Daher werden Empfehlungen bzw. Strategien für Software­nutzer gegeben. Abschnitt 8 stellt die Schnittstellen zwischen den Modulen PIAFStat / Verfahren DESIGN und der PIAF-Datenbank vor. Darauf aufbauend wird In Abschnitt 9 gezeigt, wie die Designvorgaben dann in der späteren Einzelversuchs­auswertung mit PIAFStat (EVA bzw. ZVA) wirksam werden - das Ziel ist ein in sich stimmiges Gesamtsystem und die Einheit von Design und Auswertungsmodell.

Die Palette der für PIAFStat entwickelten Verfahren wird durch DESIGN komplettiert. Die Abfolge der Versuchsbearbeitung in dem Verfahrens-Komplex Design à Plausi à Eva/Zva à Hohenheim-Gülzower-Serienauswertung baut logisch aufeinander auf und stellt einen in Nutzerführung und Funktionalität stimmigen Gesamtkomplex dar. Dies gewährleistet, dass von Versuchs­planung über Plausibilitätsprüfung, Einzelversuchsauswertung bis hin zu hochkom­plexen Serienauswertungen ein Prozess stattfindet, welcher die Chancen auf Fehler­minimie­rung und Verbesserung von Wiederholbarkeit und Reproduzierbarkeit verdichteter Ergebnisse für die Praxis erhöht.

 aus 2. Ziele

  • Erhöhung der Präzision und Reproduzierbarkeit von Versuchsergebnissen
  • Minderung von Störungen durch Bodenheterogenität, durch versuchstechnische Einflüsse und durch Nachbarschaftseffekte zwischen Prüfgliedern
  • (Verbindung des Erfahrungswissens um die typischsten Fehlerquellen mit Prinzipien der Randomisationstheorie)
  • Entwicklung einer nutzerfreundlichen Softwarelösung im PIAF-System
  • (Integration eines PIAFStat-Verfahrens zur Konstruktion des Versuchsdesigns, der Randomisationspläne und zum Einlesen der Randomisationspläne und Blockungs-Variablen in PIAF)
  • Bereitstellung eines entsprechenden PIAFStat-Verfahrens mit Nutzerhandbuch für die Bund-Länder-Gemeinschaft PIAF

 aus 3. Einführung - Veranlassung für Innovationen in Design und Randomisation

Die Erstellung von Versuchsdesigns erfolgte bei den meisten Nutzern auf sehr veraltetem Stand, Randomisations-Prinzipien wurden oft verletzt und in der Auswertung stimmten Design und Modell häufig nicht überein.

Um die 80’er Jahre des 20. Jh. entstand folgende Divergenz:

  • einerseits: biometrische Randomisations-Prinzipen mit immer weitergehen­der kombinato­rischer Verfeinerung (halbblancierte Gitterquadrate, Youden-Quadrate, Kubische Gitter, Rechteckgitter …), aber zunehmend abgekoppelt von realen praktischen Fehlerquellen; diese Anlagen hielten in praxi kaum Einzug / hatten wenig praktische Resonanz; derartige unvollständige Blockungs­prinzipien können zwar ggf. einen Teil der Varianz fassen, passen aber im Ansatz kaum noch zu den Strukturen der Fehlerursachen (diskrete Block­grenzen versus gleitenden Bodentrends u.v.m.)
  • anderseits: im angewandten Versuchswesen Tendenz zur Nutzung immer gleicher veröffentlichter ‚gerechter Pläne‘, die den typischen Fehlerquellen lt. praktischen Erfahrungen gerechter werden sollten, aber häufig mit der Randomisationstheorie kolli­dier­ten und dann suboptimal im Ergebnis sind (Güte der Fassung der Varianzen; Qualität von Wahrscheinlichkeits­aussagen, korrelierte Fehler in Versuchsserien).

Das Verfahrens DESIGN soll diese Divergenz auflösen, also die begründeten praktischen Anforderungen mit der Randomisationstheorie in Einklang und Design, Randomisation und Auswertung in Deckung bringen.

aus 5. Prophy­lak­tische Berücksichtigung typischer Fehlerquellen durch das Verfahren ‚DESIGN‘

Typische Quellen des Versuchsfehlers (Fehlerarten)

Die unterschiedlichen Herangehensweisen der Versuchsansteller in der Gestaltung des Versuchsdesigns stehen in engem Zusammenhang mit der prinzipiellen Art zu erwartenden Störungen. Hierbei wird allerdings davon ausgegangen, dass es vor Versuchsanlage Anhalts­punkte oder Vorkenntnisse für die konkrete Art und Ausprägung möglicher Störungen gibt. Gerade dies ist allerdings sehr häufig nicht oder nicht hinreichend gegeben. Vielmehr können erfahrungsgemäß die meisten eingetretenen Problemarten rückblickend als nicht konkret erwartet eingeschätzt werden. Allerdings ist die Anzahl der maßgeblichen Arten von Störungen überschaubar. Konkret und individuell ist dann letztlich die Ausprägung im einzelnen Versuch.

Entgegen dem Herangehen, bei der Wahl des Versuchsdesigns im Wesentlichen eine dominante Störwirkung zu berücksichtigen, beinhaltet dieses Konzept den Ansatz, drei wesentlichen Arten von Störungen gleichzeitig zu berücksichtigen. Tritt dann die eine oder andere Störung auf, ggf. auch in Kombination, so soll (1) diese Störung im Aus­wertungs­modell berücksichtigt werden können und (2), wenn letzteres aus unterschied­lichen Gründen nicht erfolgt (z.B. Modell konvergiert nicht uvm.), so soll das Design und die konkrete Randomisation bewirken, dass die Mittelwert­differenzen auch ohne Berücksichtigung im Auswertungsmodell möglichst kaum verzerrt geschätzt werden.

Störungen, welche nur Einzelparzellen betreffen, ohne das ein räumlichen Zusammenhang über mehrere Parzellen besteht, können nicht durch die Designwahl gegriffen werden, sondern nur durch intensive Beobachtung und Dokumentation und ggf. im Zuge der Auswertung. Im Weiteren werden daher nur Störungen berücksichtigt, bei denen ein räumlicher Zusammenhang besteht.

Bodenheterogenität - Latinisierung und räumliche Verteilung

Es wird davon ausgegangen, dass Bodenheterogenität i.d.R. in der Fläche gleitend und nicht distinkt vorliegt - insofern ist Blockbildung a priori nur bedingt geeignet und kann nur anteilig Fehler minimierend wirken. Der Natur dieser Fehlerquelle könnten räumliche Ansätze  - Autokorrelation oder Trends - auswertungsseitig häufig eher entsprechen. Abgeleitet aus dieser Betrachtung sollte eine gleichmäßige räumliche Verteilung der Wiederholungen je Prüfglied prophylaktisch wirkungsvoll sein.

Dieses Ziel wird durch zwei parallele Strategien berücksichtigt:

  • Einbindung eines Parameters für die räumliche Korrelation in der Versuchsfläche,
  • Latinisierung (übergeordnete Blockbildung) in ein bis drei Hauptrichtungen,

Nachbarschafts - Beeinflussungen

Bei vielen Kulturarten berühren sich die Prüfglieder ohne Einmantelung an der langen Parzellenkante. Zwischen diesen benachbarten Prüfgliedern können konkurrierende Interak­tionen eintreten, die die Schätzung von Prüfgliedmittelwerten und - differenzen verzerren. Werden regelmäßig relevante Nachbarschaftseffekte erwartet, so ist eine Ummantelung zwingend erforderlich (plot-in-plot-Parzellen bei Raps, Kern- und Randreihen bei Mais, Ummantelung von Düngungsparzellen oder Kontrollparzellen etc.). Aber auch wenn nach Abwägung von Aufwand-Nutzen eine Einmantelung unterbleibt, sind Nachbarschaftseffekte nicht gänzlich auszuschließen. Da häufig von einzelnen Prüfgliedern besonders intensive Nachbarschaftseffekte ausgehen (z.B. sehr kurze oder sehr lange Sorte), sollten die paar­weisen Nachbarschaften bestmöglich ausbalanciert werden, sodass kein Prüfgliedpaar öfter als vermeidbar miteinander benachbart ist.

Das Ziel der Nachbarschaftsbalancierung wird  in Kombination mit den anderen Designzielen durch Einbindung eines Korrelation-Parameters innerhalb von Zeilen erreicht.

Zeilen- und Spalten - Effekte

Versuchsansteller wollen i.d.R. vermeiden, dass ein Püfglied mehrmals bzw. öfter als vermeid­bar in der gleichen Zeile oder Spalte steht. Hintergrund ist die Erwartung, dass in gleicher Zeile oder Spalte Störeffekte korreliert sein können und nicht mehrmals auf das gleiche Prüfglied einwirken sollen. Hintergrund ist, dass nahezu alle technischen  Arbeiten während des Versuches und auch in der Vorgeschichte genau im Parzellenraster mit den Zeilen oder mit den Spalten erfolgen. Bei technischen Arbeiten ist aber absolute Gleichheit über die Fläche nicht erreichbar. Traktorreifen hinterlassen Spuren, kein Düngerstreuer und keine Feldspritze hat eine absolut exakte Querverteilung, Drillscharre können in einer Fahrt verstopfen, nach dem Wenden aber wieder frei sein u.v.m. Die Folge sind distinkte Effekte für komplette Zeilen bzw. Spalten. Je besser die Zeilen- und Spalten-Balancierung ist, desto weniger verzerrend wirken sich derartige Störeffekte aus und desto größer sind die Chancen für eine Effektbereinigung.

Das Ziel der Zeilen-Spalten-Balancierung wird in Kombination mit den anderen Designzielen durch Einbindung einer Zeilen- und einer Spaltenvarianz erreicht.

Kombination der drei Prinzipien

In aller Regel ist zum Zeitpunkt der Versuchsplanung nicht vorhersehbar, ob, in welchem Maße und welche Art Störungen / Versuchsfehlern eintreten. Insofern erscheint es aus prophy­laktischen Risikoerwägungen am aussichtsreichsten, alle drei Grundmuster im Versuchs­design simultan zu berücksichtigen. Und zwar selbst dann, wenn man in dieser Kombination nicht völlig, aber annähernd den Grad z.B. der Zeilen-Spalten-Balancierung erreicht wie ein reiner Zeilen-Spalten-Plan, oder die Nachbarschaftsbalancierung, wie ein ausschließlich nach­bar­schafts­balancierter Plan etc. Die möglichen Kombinationen von Designvorgaben sind sehr vielfältig, sie gehen weit über die bisher verbreiteten ‚Anlagemethoden‘ (wie einfaktorielle Blockanlage, Lateinisches Rechteck, Alpha-Gitter ...) hinaus. Alle im Ergebnis dieser Arbeit empfohlenen Designs haben die Grundstruktur eines Zeilen-Spalten-Planes. Alle Designerweiterungen führen zu Anlagen, die mit dem Sammel­begriff ‚Erweiterte Zeilen-Spalten-Plänen‘ bezeichnet werden können.

Erste Analysen haben gezeigt, dass sich die drei Ziele (a) gleichmäßige Verteilung, (b) Zeilen- und Spalten-Balancierung und (c) Nachbarschafts-Balancierung im Sinne einer Gesamt-Optimierung, von Ausnahme-Konstellationen abgesehen, meist gut verknüpfen lassen (Abb. 7).

aus 10. Einheit von Design und Auswertung

Ein Grundsatz der Planung uns Auswertung von Feldversuchen ist, dass die Design­vorgaben das Auswertungsmodell bestimmen, Design und Auswertungsmodell sollen eine Einheit bilden. Ein Auswertungsansatz, welcher nicht das Design widerspiegelt, stellt kein der Realität angemessenes Modell dar. Die Palette der für PIAFStat entwickelten Verfahren greift diesen Ansatz auf. Die Abfolge der Versuchsbearbeitung in dem Verfahrens-Komplex Design à Plausi à Eva/Zva à Hohenheim-Gülzower-Serienauswertung baut logisch aufeinander auf und stellt einen in Nutzerführung und Funktionalität abgestimmten Gesamtkomplex dar. Dies gewährleistet, dass von Versuchs­planung über Plausibilitäts­prüfung, Einzelversuchsauswertung bis hin zu hochkomplexen Serien­auswertungen ein stimmiger Prozess stattfindet, welcher die Chancen auf Fehler­mini­mierung und Verbesserung von Wiederholbarkeit und Reproduzierbarkeit zusammen­fassend verdichteter Ergebnisse für die Praxis erhöht.

Ggf. treten bei der Auswertung mit sehr komplexen Modellen Konvergenz-Probleme auf. Andererseits ist auch kaum zu erwarten, dass alle prophylaktisch berücksichtigten Fehlerarten tatsächlich zugleich eintreten. Erfahrungsgemäß treten im Einzelfall äußerst selten mehr als ein bis zwei relevante Störgrößen gleichzeitig in relevantem Ausmaß auf. Insofern bietet es sich an, das Modell im Zuge der Auswertung zu reduzieren. Dies kann im PIAFStat-Verfahren EVA automatisiert werden. Traditionell war eine derartige Modell­reduktion im Hinblick auf theoretische Forderungen nicht üblich - allerdings waren die Designvorgaben auch relativ überschaubar. Im Zuge der Entwicklung komplexerer Designvorgaben in gemischten Modellen, der Einbeziehung von räumlicher Kovarianz, von Kovariablen oder Post-Blocks u.v.m. wurden zunehmend objektivierte Verfahren der Modellreduktion entwickelt und akzeptiert. Entscheidend ist dabei zum einen, dass die Reduktion nicht subjektiv und nicht z.B. nach Variationskoeffizient oder Grenzdifferenz erfolgt, sondern nach einem objektivierten Minimierungsparameter (AICC). Und zum anderen soll das Aus­gangs­­modell (vor der Reduktion) das Design völlig widerspiegeln. Erst im Zuge der Reduktion entsteht dann aus dem komplexeren Ausgangsmodell ein simpleres pragmatisches Endmodell, welches nur noch im konkreten Versuch relevante Design­vorgaben abbildet.

Die DESIGN-Vorgabe einer räumlichen Varianz in der Fläche stellt eine zulässige und aussichtsreiche Voraussetzung dar, Heterogenität in der Fläche auch in der Einzel­versuchs­­aus­wertung zu berücksichtigen. Es ist vorab nicht absehbar, ob diese Berücksichti­gung ggf. eher durch ein Autokorrelationsmodell (zufällig, amorph à Schrumpfung) oder durch eine polynome zweidimensionale Regression (fix, polynomisch à ohne Schrumpfung)  erfolgen sollte bzw. ob sie ganz verworfen wird.

Dokumente

Herausgeber Landesforschungsanstalt für Landwirtschaft und Fischerei Mecklenburg-Vorpommern
Verfasser Dr. Volker Michel, Dr. Andrea Zenk
Erscheinungsdatum 22.03.2018
Telefon 03843 / 789-210
E-Mail v.michel@lfa.mvnet.de