SNF Forschungsdatenbank P3 - Publikationen


Applikation zur Visualisierung der Publikationen, die im Rahmen von Projekten, die vom Schweizerischen Nationalfonds (SNF) gefördert wurden, entstanden sind. Erstellt im Rahmen der Open Data Vorlesung der Universität Bern im Frühjahr 2016.

Seit Ende 2011 werden Daten zu bewilligten Projekten, Publikationen und Personen auf der Datenbank P3 des SNF öffentlich gemacht. Die Visualisierung zeigt das Publikationsverhalten der durch den SNF geförderten Projekte, gemäss den Angaben der Forschenden. Es werden nur Projekte aufgeführt, für die Publikationsdaten eingegeben wurden. Sie ist nicht geeignet, die Projekte zu bewerten oder zu vergleichen. Vielmehr geht es darum, der Öffentlichkeit auf interaktive Weise zu zeigen, welchen wissenschaftlichen Output in Form von Publikationen, die vom SNF geförderten Projekte generieren.

Visualisierung

Bitte beachten Sie die Hinweise zur Benutzung der Applikation. Unter Analyse und Interpretation der Daten finden Sie weiterführende Informationen und Erklärungen zu den in der Applikation enthaltenen Daten.

Stand der Daten 09.04.2016

Hinweise zur Benutzung

Im Scatterplot wird pro Projekt ein Kreis gezeichnet, wobei die Kreisgrösse proportional zur Anzahl der angegebenen Publikationen ist. Auf der x-Achse ist die Projektdauer und auf der y-Achse der zugesprochene Betrag ersichtlich.
Im Balkendiagramm wird die Aufteilung auf die verschiedenen Publikationstypen für die über die Filterung getroffene Auswahl dargestellt.

Die verwendeten Publikationsdaten werden von den Forschenden eingegeben. Sie umfassen sowohl veröffentlichte als auch zur Veröffentlichung angenommene Publikationen. Der SNF unterzieht die eingegebenen Daten keiner systematischen Kontrolle. Die Gewährleistung der Vollständigkeit und Richtigkeit dieser Daten liegt deshalb in der Verantwortung der verantwortlichen Gesuchstellenden.

Zoomfunktion
In den Scatterplot ist eine Zoomfunktion integriert. Mit der Scrollfunktion Ihres Gerätes (Scrollrad der Maus, Touchpad etc.) können Sie rein- und rauszoomen. Alternativ können Sie mit einem Doppelklick an leerer Stelle innerhalb des Scatterplots (nicht auf die Kreise klicken) reinzoomen. Zudem können Sie sich innerhalb des Scatterplots auf den Achsen via Ziehen bei gedrückter Maustaste (Drag) bewegen. Ein Rauszoomen auf die anfängliche Darstellung ist über den Button „Reset Zoom“ möglich.

Mouseover
Wenn Sie mit dem Mauszeiger über die Kreise fahren, werden die Details (Projektnummer, Kategorie der Förderungsinstrumente, Projektdauer, bewilligter Betrag und Anzahl Publikationen) eines Projekts angezeigt. Durch Reinzoomen können Sie auch Projekte, die sich hinter übereinanderliegenden Kreisen verbergen, einzeln betrachten. Alternativ können Sie auch nach einem spezifischen Projekt suchen (siehe unten "Suche nach Projektnummer"). Wenn Sie auf einen Kreis klicken, öffnet sich in einem neuen Fenster die P3-Seite des entsprechenden Projekts und Sie können dort weitere Details zum Projekt einsehen.

Filtermöglichkeiten
Die Daten können nach Abteilung, Forschungsgebiet, Disziplin und Kategorie der Förderungsinstrumente gefiltert werden. Bitte benutzen Sie nur einen der Filter Abteilung, Forschungsgebiet und Disziplin auf einmal. Wenn die gewählte Disziplin nicht zu dem vorher gewählten Forschungsgebiet respektive der Abteilung gehört, werden sonst keine Kreise mehr angezeigt. Eine Übersicht über die Disziplinen des SNF finden Sie hier.
Ihre gewählten Filtereinstellungen können Sie mit einem Klick auf den Button „Reset Filter“ rückgängig machen. Mit Klick auf diesen Button werden wieder alle Projekte angezeigt.

Suche nach Projektnummer
Wenn Sie wissen möchten, wo sich ein bestimmtes Projekt verortet, können Sie die entsprechende Projektnummer im Feld "Search by Project Number" eingeben. Nach Klick auf den Button wird der Kreis des gesuchten Projektes nach vorne gebracht und farblich hervorgehoben. Mit einem Klick auf den Button "Reset Highlight" wird die Hervorhebung der gesuchten Projekte wieder entfernt. Sollte diese Suche kein Ergebnis liefern, liegt dies mit grosser Wahrscheinlichkeit daran, dass für das entsprechende Projekt noch keine Publikationen angegeben wurden. In diesem Fall können Sie auf der Datenbank P3 des SNF Details zum Projekt einsehen.

Daten

Die verwendeten Daten stammen von der Datenbank P3 des SNF und können dort im CSV Format heruntergeladen werden. Für die vorliegende Datenvisualisierung wurden die Datensätze P3_GrantExport.csv mit Projektdaten und P3_PublicationExport.csv mit den Publikationsdaten benutzt.

Projektdaten
Dieser Datensatz enthält die Daten zu den vom SNF geförderten Projekten, die in der Datenbank P3 enthalten sind. Er umfasst Daten von 1975 bis heute, wobei die Vollständigkeit der Daten, insbesondere vor 2000, nicht gewährleistet werden kann. Dies stellt für diese Visualisierung insofern kein Problem dar, als dass nur ganz wenige der hier dargestellten Projekte vor dem Jahr 2000 beendet wurden.

Publikationsdaten
Seit August 2011 erfasst der SNF systematisch die Daten zum wissenschaftlichen Output der von ihm geförderten Projekte. Zum wissenschaftlichen Output zählen unter anderem die Publikationen, es werden aber noch weitere Daten wie z.B. zu wissenschaftlichen Veranstaltungen oder Auszeichnungen erhoben. Für Projekte, die vor August 2011 beendet wurden, ist die Angabe dieser Daten freiwillig. Die Einreichung der Outputdaten ist bei Projektende zusammen mit der Erstellung des wissenschaftlichen Berichtes erforderlich und bis mindestens zwei Jahre nach Projektende erwünscht.
Im Moment sind lediglich die Publikationsdaten frei zugänglich. Da der SNF diese keiner systematischen Kontrolle oder Überprüfung unterzieht, gewährleisten ausschliesslich die verantwortlichen Gesuchstellenden die Vollständigkeit und Richtigkeit dieser Daten.

Eine detaillierte Beschreibung der Datenfelder, die in den beiden Datensätze enthalten sind, ist auf der Dokumentationsseite der Datenbank P3 unter „Beschreibung Exportfelder“ einsehbar.

Vorgehen
  1. Zusammenfügen der beiden Datensätze
    In einem ersten Schritt habe ich die beiden Datensätze in Access anhand der Projektnummer zusammengefügt. Daraus ergab sich eine Exceldatei mit einer Zeile pro Publikation an die jeweils die Projektinformationen angehängt waren.

  2. Reduktion und Bereinigung der Daten
    Als nächstes habe ich die Daten in Excel reduziert. Dazu habe ich für jedes Projekt die Anzahl der Publikationen, insgesamt und je Publikationstyp gezählt, so dass die Daten eines Projekts schlussendlich auf einer Zeile Platz fanden. Weiter habe ich Bereinigungen an den Namen der Disziplinen und der Förderungsinstrumente vorgenommen und die Projektdauer aufgrund des Start- und Enddatums berechnet. Noch nicht abgeschlossene Projekte und Projekte, für die keine Information zum zugesprochenen Betrag verfügbar ist (Mobilitätsstipendien), habe ich von der Analyse ausgeschlossen.

  3. Auswahl der Art der Visualisierung
    Da ich die Daten bereits relativ gut kannte, war relativ schnell klar, dass die Visualisierung die Anzahl Publikationen pro Projekt in Verbindung mit der Projektdauer und dem bewilligten Betrag dargestellt werden sollten. Die Wahl fiel auf einen Scatterplot, mit der Projektdauer auf der x-Achse und dem bewilligten Betrag auf der y-Achse, bei dem die Kreisgrösse von der Anzahl Publikationen abhängt. Zusätzlich dazu wollte ich ein horizontales Balkendiagramm erstellen, das anzeigt wie sich die Publikationen auf die verschiedenen Publikationstypen aufteilen. Dazu noch eine Anzeige, mit den wichtigsten Durchschnittswerten zur Orientierung.
    Eine weitere Anforderung war, die beiden Diagramme inkl. der Anzeige der Durchschnittswerte miteinander verbunden nach bestimmten Variablen (Forschungsgebiet, Disziplin, Kategorie der Förderungsinstrumente) filtern zu können.

  4. Erstellung der Visualisierung
    Der Scatterplot basiert auf dem Beispiel „D3 Zoomable Scatterplot“ von Jonas Petersson auf der Website bl.ocks.org. Die Daten befanden sich dafür schon in der richtigen Form, so dass die Integration der SNF-Daten relativ problemlos war. Einige Anpassungen musste ich dennoch vornehmen. Das horizontale Balkendiagramm baute ich, unter Zuhilfenahme des Buchs „Interactive Data Visualizations for the Web“, selber. Weitaus schwieriger war der Einbau der Filter. Insbesondere die funktionale Verknüpfung mehrerer Filter sowie das gleichzeitige Filtern beider Diagramme stellten sich als herausfordernd heraus.

  5. Erstellung der Webseite
    In einem letzten Schritt habe ich die vorliegende Webseite gestaltet und die Visualisierung darin eingebettet. Das Layout der Webseite basiert auf einem Code Snippet von bootsnipp.com

  6. Weitere Schritte
    Eine mögliche Weiterentwicklung sehe ich in der direkten Verknüpfung mit den Daten von der Forschungsdatenbank P3. Weiter könnte auch die Filtermöglichkeit noch verbessert werden. So wäre es sicher benutzerfreundlicher, wenn die drei jetzigen Filter (Division, Research Area und Discipline) zu einem hierarchisch aufgebauten Filter umfunktioniert würden.
Analyse und Interpretation der Daten

An dieser Stelle sei nochmals darauf hingewiesen, dass die Angaben zu den Publikationen durch die Forschenden eingegeben werden und ausschliesslich die verantwortlichen Gesuchstellenden die Vollständigkeit und Richtigkeit dieser Daten gewährleisten. Wenn ein Projekt also sehr wenige Publikationen aufweist, bedeutet das nicht gezwungenermassen, dass in diesem Projekt nicht mehr Publikationen entstanden sind. Die Publikationen sind allenfalls erst noch im Entstehen oder wurden in den Systemen des SNF noch nicht angegeben.


Projektdauer und bewilligter Betrag

Projektdauer
Insgesamt dauern die meisten Projekte um die 30 Monate. Eine Ausnahme bilden die Projekte in der Wissenschaftskommunikation, die meist sehr viel kürzer sind. Auch die Projekte in der Kategorie Infrastrukturen dauern etwas weniger lang. Die Projekte in den Programmen hingegen dauern länger. Diese Unterschiede hängen mit den unterschiedlichen Zielsetzungen und Reglementen der Förderungsinstrumente zusammen.

Bewilligter Betrag
Die höchsten Beträge werden in der Karriere- und der Programmförderung bewilligt. Die niedrigsten Beträge wiederum gibt es in der Wissenschaftskommunikation. Auch hier hängt das mit den verschiedenen Zielsetzungen und Reglementen zusammen. So werden z.B. in der Karriereförderung das Salär bzw. Stipendium des Gesuchstellenden sowie je nach Förderungsinstrument auch weitere finanzielle Mittel zur Durchführung des Forschungsvorhabens durch den Betrag des SNF gedeckt.

Verhältnis Projektdauer und bewilligter Betrag
Grundsätzlich wird ersichtlich, dass mit der Projektdauer auch der bewilligte Betrag zunimmt. Dieser Zusammenhang ist in der Projektförderung und der Karriereförderung am ausgeprägtesten.


Publikationen

Es ist zu beachten, dass in dieser Visualisierung nur die Projekte aufgeführt wurden, für die Publikationen angegeben wurden. Dadurch fällt die durchschnittliche Anzahl Publikationen höher aus, als wenn auch die Projekte ohne Publikationen miteinbezogen würden.

Anzahl Publikationen
In der Programm- und Karriereförderung scheinen durchschnittlich am meisten Publikationen zu entstehen. Darauf folgen die Projekt- und Infrastrukturförderung. In der Wissenschaftskommunikation entstehen die wenigsten Publikationen. Dies liegt unter anderem daran, dass bei Publikationsbeiträgen, die dieser Förderungskategorie angehören, das Ziel eine einzelne Publikation ist.
Bezüglich der Disziplinen zeigt sich, dass in Mathematik, Natur- und Ingenieurwissenschaften am meisten Publikationen angegeben werden, gefolgt von Biologie und Medizin. Besonders hohe Publikationsaufkommen (bei ausreichend hoher Anzahl Projekte) weisen dabei die Disziplinen 20403 Elementarteilchenphysik, 20200 Astronomie, Astrophysik und Weltraumforschung und 30716 Klinische Endokrinologie auf.
In den Geistes- und Sozialwissenschaften werden weniger Publikationen angegeben. Dies zeigt sich z.B. auch in den bibliometrischen Untersuchungen zur Forschung in der Schweiz des Staatssekretariats für Bildung, Forschung und Innovation (SBFI). Es gibt verschiedene Gründe wieso das Publikationsaufkommen in den Geistes- und Sozialwissenschaften niedriger ausfällt. Ein wichtiger Grund ist, dass häufiger Publikationstypen gewählt werden, für die es länger dauert, bis eine Publikation tatsächlich veröffentlicht wird (mehr Bücher, Buchbeiträge und Herausgeberschaften und weniger Originalbeiträge in wissenschaftlichen Zeitschriften).

Publikationstypen
Der Grossteil der Publikationen insgesamt, gut 70%, entfällt auf Originalbeiträge in wissenschaftlichen Zeitschriften. In der Wissenschaftskommunikation entfallen fast 80% der Publikationen auf Bücher, Buchbeiträge und Herausgeberschaften. Dies liegt, wie oben erwähnt, am Ziel, das mit den dieser Kategorie zugehörenden Förderungsinstrumenten verfolgt wird. In der Programmförderung werden ebenfalls überdurchschnittlich oft Buchbeiträge angegeben. In den anderen Kategorien gibt es keine wesentlichen Unterschiede bezüglich den Publikationstypen.
Bei den Geistes- und Sozialwissenschaften sind lediglich 40% der Publikationen Originalbeiträge. Hingegen beträgt der Anteil an Buchbeiträgen 31% und der Anteil der Bücher 9%. Hinzu kommen 6% Konferenzbeiträge und 5% Herausgeberschaften.
In den Mathematik, Natur- und Ingenieurwissenschaften und in Biologie und Medizin werden mit 77% respektive 83% klar am meisten Publikationen als Originalbeiträge veröffentlicht. In den Mathematik, Natur- und Ingenieurwissenschaften werden zudem 13% Konferenzbeiträge (Proceedings) angegeben, welche vor allem in den Ingenieurswissenschaften entstehen. In Biologie und Medizin wiederum sind 13% der Publikationen Review Artikel.

Verwendete Dateien
Beschreibung Dateiformat Link
Rohdaten zu den Projekten .csv link
Rohdaten zu den Publikationen .csv link
Zusammengeführte Projektdaten und Publikationsdaten .xlsx link
Bearbeitete Projektdaten und Publikationsdaten .xlsx link
Quelldatei für die Visualisierung .csv link