Challenges im DF - Bewertungssystem

  • Falscher Thread, oder? ;)


    Hab's mir mal aufgeschrieben. Werde wohl mal mitmachen. Ich such z.Z. sowieso immer Material für meinen YT-Kanal. Wobei meine ToDo-Liste da andererseits eigentlich schon aus allen Nähten platzt mit anspruchsvollem und Zeitintensivem Zeug (aktuell "Seven Days" von Sting / Colaiuta).

    Die Thomann-Challenge dürfte ich vergleichsweise schnell fertig haben.


    Was die Planung für nächstes Jahr betrifft, werde ich das genau so wie oben beschrieben machen. Also zwei Challenges im Frühjahr direkt nacheinander und eine im November.

    Das passt mir nächstes Jahr auch besser. :thumbup:

  • Habe die Tracks für die beiden anstehenden Challenges gekauft und zum Einspielen mit eigenen Klicktracks vorbereitet. Die Kürzungen habe ich (nach ein bisschen Probieren) simpel gehalten und jeweils nur das Ende angeflanscht, damit's nach was klingt. So kommt der Jazz auf 132-135 Sek. und der Reggae auf 123 Sek. reine Spielzeit.


    Der Reggae ist trotz des triolischen Feels Anfänger-freundlich und macht bestimmt vielen Leuten Spaß. Demgegenüber ist der Jazz-Track noch mal ziemlich anspruchsvoll. Da habe ich auch wieder Hinweis-Klicks (am Ende des Intros und vor dem Outro) eingebaut.


    Das ganze soll wie folgt ablaufen:


    01.02. - 21.02. Spielphase erste Challenge (Jazz)

    23.02. - 01.03. Votingphase erste Challenge (Jazz)


    03.03. - 23.03. Spielphase zweite Challenge (Reggae)

    25.03. - 31.03. Votingphase zweite Challenge (Reggae)


    Niop wird sich wieder um das Voting kümmern.


    Hier noch mal die beiden Tracks:


    Externer Inhalt youtu.be
    Inhalte von externen Seiten werden ohne deine Zustimmung nicht automatisch geladen und angezeigt.
    Durch die Aktivierung der externen Inhalte erklärst du dich damit einverstanden, dass personenbezogene Daten an Drittplattformen übermittelt werden. Mehr Informationen dazu haben wir in unserer Datenschutzerklärung zur Verfügung gestellt.


    Externer Inhalt youtu.be
    Inhalte von externen Seiten werden ohne deine Zustimmung nicht automatisch geladen und angezeigt.
    Durch die Aktivierung der externen Inhalte erklärst du dich damit einverstanden, dass personenbezogene Daten an Drittplattformen übermittelt werden. Mehr Informationen dazu haben wir in unserer Datenschutzerklärung zur Verfügung gestellt.

  • m_tree

    Hat den Titel des Themas von „Challenges im DF - Planung für 2026“ zu „Challenges im DF - 2 anstehende im Februar + März“ geändert.
  • Mal sehen, ob ich es dieses mal wieder schaffe...

    Die gekürzten Tracks kommen dann zum Spielphasen-Beginn, wie gehabt, oder?

    Four on the floor sind zwei zu viel.

    SONOR Vintage Series: 20", 22" BD; 14" Snare-Drum; 10", 12", 13" TT; 14", 16" FT

    PAISTE 2002, 2002 Big Beat, 602 Modern Essentials, PstX

    Gigs: 23.01.26 Markthalle Freiburg, 21.03.26 Heimathafen Lörrach, 09.05.26 KiK Offenburg, 19.06.26 Haferkasten Kenzingen, 19.09.26 Mehlsack Emmendingen, 03.10.26 Private VIP Gig, 31.10.26 Durbacher Hof Offenburg, 21.11.26 Bierakademie VS, 28.11.26 Heimathafen Lörrach mit >> Blackwood Mary

    >> Mein Vorstellungsthread

  • Die gekürzten Tracks kommen dann zum Spielphasen-Beginn, wie gehabt, oder?

    Ja. Ich denk mal das passt so. Hab die sowieso noch nicht endgültig fertig, was die Lautstärke-Verhältnisse der Klicktracks zu den Playalongs und die finalen Renderings betrifft. Dafür werde ich beide Tracks auch noch mal praktisch am Schlagzeug testen, das ist für alle Beteiligten sinnvoll (besonders für die, die ohne DAW und ohne getrennte Spuren für Playalong und Klick aufnehmen). Muss damit aber auch gerade noch etwas warten, weil ich mich kürzlich am linken Handgelenk verletzt hatte und momentan nicht richtig spielen kann (den nächsten Gig hab ich zum Glück erst wieder Ende Januar).


    Es besteht ja trotzdem die Möglichkeit, sich schon vor den Spielphasen mit den Tracks zu beschäftigen. Die Track-Auswahl steht auch schon wieder seit zwei Monaten fest. ;)

  • Es wurde an anderer Stelle Kritik zum aktuellen Bewertungssystem geäußert:

    Eine solche Challenge ist aber problematisch, wenn jeder bei der Beurteilung bzw. beim Voten andere Ansätze hat! Der eine gibt Punkte zwischen 5 bis 10 und der andere von 1 bis 10. Hinzu kommt, dass jeder von der Musik/ Jazz was anderes versteht.

    Taten bringen wenig, wenn ein gemeinsamer Ansatz beim Voting fehlt.


    Mich würde nun interessieren, wie andere das sehen. Meine Antwort dazu lautete:


    "Bei der ersten Playalong-Challenge hatte ich noch ein 5-Punktesystem und in das Voting-Formular ausdrücklich geschrieben, dass die Punktespanne voll ausgereizt werden soll. Mit dem Hinweis, dass sich das Voting nur auf die vorhandenen Beiträge und nicht "hätte auch jemand besser spielen können" beziehen soll.


    Das Ende vom Lied war dann aber, dass manche die Punktespanne trotzdem nicht ausgereizt hatten. Man ist da leider einfach machtlos und kann niemandem vorschreiben, wie er zu voten hat. Letztendlich kann man in dem Kontext sogar froh sein, dass so ein Voting überhaupt irgendwie funktioniert.


    Die Alternative wäre eine Jury-Bewertung. Das müsste man aber erstmal irgendwie bewerkstelligen. Und ich persönlich möchte definitiv kein Jury-Mitglied sein.


    Die Lösung ist, das ganze etwas lockerer und spielerischer anzugehen. Ist manchmal nicht einfach, aber definitiv eine gute Übung."

  • m_tree

    Hat den Titel des Themas von „Challenges im DF - 2 anstehende im Februar + März“ zu „Challenges im DF - Bewertungssystem“ geändert.
  • Ich hatte mich bei der Bewertung genau das gefragt: sollte man die Bewertung relativ sehen (schlechtester DF-Beitrag = 1, bester = 10) oder absolut (talentfreier Anfänger = 1, Tony Williams = 10)?


    Letztlich habe ich dann aber auf dem Formular gesehen, dass 1 = sehr schlecht und 10 = sehr gut sein sollte und habe das dann so verstanden, dass die Skala absolut zu sehen ist. Deswegen habe ich nicht den kompletten Rahmen genutzt.


    Für ein Problem halte ich das eher nicht, denn ich denke solange genügend Leute voten, gleicht es sich ja irgendwie aus - irgendwer bewertet streng, irgendwer schmeißt alle mit hohen Punktzahlen zu und die meisten sind irgendwo dazwischen.


    Falls aber trotzdem gewünscht ist, dass alle Voter quasi die gleiche Spanne verwenden, würde ich vorschlagen, dass man beim Voten nicht Punkte vergibt, sondern die Beiträge in eine Reihenfolge setzt (bester -> schlechtester). Damit wäre gewährleistet, dass die Statistik nicht durch besonders kritische oder besonders großzügige Bewerter verzerrt wird.


    Allerdings könnte man dann keine Beiträge mehr als gleich gut bewerten. Und das Voting-Formular wäre vielleicht ein bisschen schwieriger zu gestalten. Irgendwas ist ja immer.

  • Ich befüchte, da muss ich mich wohl einbringen. Armer JohnDrum 😰


    Meiner Ansicht nach müsste es reichen, dass eine Extrembewertung (wie von mir zuletzt) unter den 16 weiteren abgegebenen Votings statistisch ausreichend verwässert wird, so dass es nicht extrem signifikant ist.


    Wem das nicht reicht:

    Die einzige einfache und vernünftige Gegenmaßnahme ist dann mEn, dass man wie beim Turmspringen einfach die Daten um Ausreißer bereinigt. D.h. in unserem Fall die beste Bewertung und die schlechteste Bewertung streichen und dann den Mittelwert bilden.


    Die Intensität dieser Bereinigung hängt dann aber sehr stark von der Gesamtanzahl der Votings ab.

    Bei 17 Votings wäre das schon okay, denke ich. Wenn's nur 10 Votings wären macht's natürlich schon einen erheblich größeren Unterschied.


    Solange ich meine ultrafiesen Extrembewertungen beibehalte (was keineswegs fix gesetzt ist), würde ich damit quasi mich selber ausm Voting rausdisqualifizieren. Und solange es gar keine großen Ausreißer gibt, ist die Maßnahme quasi irrelevant.


    Ich würde an JohnDrums Stelle eher drauf vertrauen, dass der verhasste haidem ja auch sein Votingverhalten mit wachsender DF-Erfahrung anpasst. Dann braucht man nix zu ändern, alle sind glücklich und JohnDrum ist weniger unglücklich.


    Oder nicht??👍

  • Letztlich habe ich dann aber auf dem Formular gesehen, dass 1 = sehr schlecht und 10 = sehr gut sein sollte und habe das dann so verstanden, dass die Skala absolut zu sehen ist. Deswegen habe ich nicht den kompletten Rahmen genutzt.

    Wir lassen das momentan ganz bewusst offen und schreiben den Leuten gar nicht vor, wie sie die Skala im Detail nutzen sollen (nur eben mehr Punkte = besser).

    Bei einer 10-Punktespanne sieht die Sache auch ganz anders aus als mit 5 Punkten. Ich hatte letztes mal auch nur 2-9 Pkt. vergeben.


    Das Voting fühlt sich einfach "natürlicher" an, wenn man die Punkte so vergibt, wie man das auch wahrnimmt. Wenn der m.E. beste Beitrag im Feld meiner Meinung nach noch Luft nach oben hat, dann ist der eben keine 10.


    Falls aber trotzdem gewünscht ist, dass alle Voter quasi die gleiche Spanne verwenden, würde ich vorschlagen, dass man beim Voten nicht Punkte vergibt, sondern die Beiträge in eine Reihenfolge setzt (bester -> schlechtester). Damit wäre gewährleistet, dass die Statistik nicht durch besonders kritische oder besonders großzügige Bewerter verzerrt wird.

    Interessante Idee!


    Bis zur vorletzten Challenge hatte ich auch noch die Punktesumme ermittelt. Gegenüber dem Punktedurchschnitt hat das zwar eigentlich nur Nachteile, auch weil die Leistungen von Challenge zu Challenge nicht vergleichbar sind. Andererseits kann die Summe aber auch nicht durch "Ausreißer" in den Bewertungen verzerrt werden. Gibt jemand nur 1-5 Pkt. zieht das den Schnitt natürlich runter, gibt jemand stattdessen nur 7-10 Pkt. zieht es den Schnitt nach oben. Es gab auch schon Leute, die nur 10 Pkt. vergeben hatten, einfach um allen Teilnehmern Respekt zu zeigen.


    Die einzige einfache und vernünftige Gegenmaßnahme ist dann mEn, dass man wie beim Turmspringen einfach die Daten um Ausreißer bereinigt. D.h. in unserem Fall die beste Bewertung und die schlechteste Bewertung streichen und dann den Mittelwert bilden.

    Die Idee hatte Niop auch schon. Finde ich persönlich aber nicht nötig, weil es sich eben sowieso irgendwie ausgleicht.


    Es waren übrigens ingesamt 19 Votings beim letzten Mal. ;)

  • Ich habe so gevotet:

    10 Punkte sind perfekt.

    Darunter abgestuft: Kleine Schwächen oder größere Schwächen.


    Bei der Jazz Challenge: Nachdem ich in den 80er und 90er Jahren sehr viel Jazz gespielt hatte: Mein Verständnis vom Jazz- Schlagzeug: Aufeinander hören und als Drummer der Rhythmusgruppe zuarbeiten. Deswegen war mir das Hören auf das Piano am wichtigsten und darauf haben manche nur bedingt gehört.


    Wenn andere aber eine Rangfolge machen und einfach von 10- 1 Punkt runterstufen, dann kommt kein vernünftiges Ergebnis zustande. Besonders, wenn beide Herangehensweisen gemischt werden.

    Eine Jury würde ich nicht machen, weil zu aufwändig.

  • Ja, ich glaub auch nicht dass wir irgendetwas ändern müssen/sollten. 1 schlechte Bewertung unter 19 (!!!) (danke für den Hinweis) ist ja noch mehr Argument, dass die statistisch entsprechend an Relevanz verliert.....ich glaub nicht, dass wir von m_tree ne Doktorarbeit haben wollen/verlangen sollten, um voten zu dürfen.

    ...korrekt.....es geht doch um nichts

    In den meisten Notizen wurde auch der Sound beurteilt. Im Voting stand geschrieben, man solle die spielerische Leistung beurteilen.

    Mach' ich da ein Fass auf???? Sicher nicht!

  • Ein wirklich ausgewogenes Voting kriegt man nur mit einer Jury hin, die zuvor bestimmte Kriterien abarbeitet, damit alle die gleichen Dinge beachten. Dazu müsste die Jury vom jeweils gespielten Genre ausreichend Ahnung haben.


    Fände ich jetzt in diesem Rahmen hier etwas überzogen. Aber es ist halt so, dass ein relativer Anfänger anders bewertet als ein alter Hase. Der erfahrene Drummer hört wahrscheinlich Dinge, die der unerfahrene nicht hört oder ganz anders gewichtet.

    Und auch unter erfahrenen Schlagzeugern gehen die Meinungen ja auseinander: dem einen ist z.B. das Timing (wie im aktuellen Fall) nicht ganz so wichtig wie dem anderen.


    Vielleicht könnte man das Problem ein Stück weit angehen, indem man Kriterien bewerten muss.


    Zum Beispiel:


    - Timing

    - Musikalität/Umsetzung des Themas

    - Songdienlichkeit

    - Kreativität

    - Gesamteindruck (Gefällt mir das als Gesamtpaket?)

    oder so.


    Ist aber nur so ein Gedanke. Ansonsten lässt man das Voting wie es ist und lebt mit den Ergebnissen. Muss man ja auch nicht so streng nehmen - das Ganze. Soll ja Spaß machen und nicht zum Wettkampf ausarten (Wobei es manchmal schon den Eindruck erweckt).

    "Ambition is a dream with a V8 engine" - Elvis Presley

  • Wenn das Voting zu kompliziert wird, dann werden weniger Leute abstimmen - das hielte ich für kontraproduktiv. Ich finde die 1-10 Variante jetzt eigentlich ganz gut.


    Was ich persönlich nicht gut finde ist, wenn man hinterher wegen seiner eigenen Abstimmung angegangen wird. Trotzdem finde ich es richtig, dass die Abstimmungsergbebnisse der Transparenz halber offengelegt werden.


    Ich bin gegen eine Jury-Bewertung, weil ich die Challenge hier eher als Sache sehe, die DF-Mitglieder untereinander aus Spaß an der Sache machen - nicht um einen Preis zu gewinnen. Auch beim Bewerten anderer Beiträge lernt man was und erweitert damit den eigenen Horizont.

  • Macht daraus keine Wissenschaft, es geht um den Spaß ;)


    Mir macht Wissenschaft auch Spaß ;)


    (Edit: und ich bin anscheinend nicht so gut darin, siehe unten :) )


    Daher habe ich (trotz der gerne zugegebenen Irrelevanz) auch noch weiter über das Voting-System nachgedacht und noch eine Schwäche bei dem jetzigen entdeckt: wenn man es aus spieltheoretischer Sicht betrachtet (also wenn man vor allem selbst am besten abschneiden möchte), belohnt das jetzige System diejenigen Teilnehmer, die nicht mit abstimmen.


    Denn dadurch, dass man sich selbst keine Punkte geben kann, gibt man sich selbst automatisch immer null Punkte, allen anderen aber mindestens einen und normalerweise mehr. Stimmt man hingegen gar nicht ab, gibt man allen null Punkte, erhält aber (wahrscheinlich) immer noch Punkte von den anderen.


    Wenn viele Leute voten, macht das kaum einen Unterschied. Aber wir sind nicht viele.


    Als konkretes Beispiel: Ich bin auf Platz 8 gelandet, hinter JohnDrum (Platz 7), Oliver_Stein und haidem (geteilter Platz 5). In Summe haben haidem und Oliver jeweils 130 Punkte bekommen, John 128 und ich 125. Ich selbst habe Oliver 9 Punkte gegeben, haidem 8 und John 7.


    Wenn ich jetzt nicht abgestimmt hätte, hätte ich selbst weiterhin 125 Punkte bekommen, aber haidem hätte nur noch 122 gehabt und Oliver und John jeweils 121. Durch diese Entscheidung wäre ich also von Platz 8 auf Platz 5 vorgerückt, haidem wäre auf Platz 6 gekommen und John und Oliver hätten sich Platz 7 geteilt.


    Versteht mich nicht falsch, ich sage und glaube ausdrücklich NICHT, dass sich irgendjemand hier im Forum diesen Mechanismus zunutze machen würde. Es geht ja um nichts und wir stehen uns glücklicherweise alle überwiegend wohlwollend gegenüber. Und ich habe Euch die Punkte gerne gegeben, Ihr habt sie Euch verdient.


    Mir macht es einfach nur Spaß, Sicherheitslücken zu finden ;)


    In dem von mir vorgeschlagenen System ist dieser Trick so nicht möglich. Völlig manipulationssicher ist es allerdings auch nicht.

    Einmal editiert, zuletzt von SleishMan ()

  • Denn dadurch, dass man sich selbst keine Punkte geben kann, gibt man sich selbst automatisch immer null Punkte, allen anderen aber mindestens einen und normalerweise mehr. Stimmt man hingegen gar nicht ab, gibt man allen null Punkte, erhält aber (wahrscheinlich) immer noch Punkte von den anderen.

    Das ist so glaube ich nicht richtig, weil in der aktuellen Wertungsmethode nicht die Punktzahl, sondern der Durchschnitt der Bewertungen (mit Ausnahme der Eigenbewertung) herangezogen wird.

    Als konkretes Beispiel: Ich bin auf Platz 8 gelandet, hinter JohnDrum (Platz 7), Oliver_Stein und haidem (geteilter Platz 5). In Summe haben haidem und Oliver jeweils 130 Punkte bekommen, John 128 und ich 125. Ich selbst habe Oliver 9 Punkte gegeben, haidem 8 und John 7.


    Wenn ich jetzt nicht abgestimmt hätte, hätte ich selbst weiterhin 125 Punkte bekommen, aber haidem hätte nur noch 122 gehabt und Oliver und John jeweils 121. Durch diese Entscheidung wäre ich also von Platz 8 auf Platz 5 vorgerückt, haidem wäre auf Platz 6 gekommen und John und Oliver hätten sich Platz 7 geteilt.

    Wenn Du selber nicht abgestimmt hättest, wäre Dein Durchschnitt gleich bei 6,944 geblieben, Haidem hätte dann 7,176 gehabt, John und ich jeweils 7,117. Deine Nichtabstimmung hätte also das Ergebnis natürlich verändert (weil Du den drei Beispielkandidaten unterschiedliche Punkte gegeben hattest), aber Dein eigenes Ergebnis wäre nicht besser geworden.

  • Das ist so glaube ich nicht richtig, weil in der aktuellen Wertungsmethode nicht die Punktzahl, sondern der Durchschnitt der Bewertungen (mit Ausnahme der Eigenbewertung) herangezogen wird.

    Ja, Du hast recht. Mir war nicht klar, dass bei der Durchschnittsberechnung der abstimmenden Teilnehmer auch durch eine Stimme weniger geteilt wird. Dann ist es natürlich Quatsch was ich geschrieben habe.

  • Wenn das Voting zu kompliziert wird, dann werden weniger Leute abstimmen - das hielte ich für kontraproduktiv. Ich finde die 1-10 Variante jetzt eigentlich ganz gut.

    Genau!


    Was ich persönlich nicht gut finde ist, wenn man hinterher wegen seiner eigenen Abstimmung angegangen wird. Trotzdem finde ich es richtig, dass die Abstimmungsergbebnisse der Transparenz halber offengelegt werden.

    Auch ein wichtiger Punkt! Ich hätte bei ein paar vereinzelten Votings in der Vergangenheit auch die Nase rümpfen können (nicht nur wegen der Bewertung meines Beitrags). Bringt aber nichts.


    Ja, Du hast recht. Mir war nicht klar, dass bei der Durchschnittsberechnung der abstimmenden Teilnehmer auch durch eine Stimme weniger geteilt wird. Dann ist es natürlich Quatsch was ich geschrieben habe.

    Niop hat das Voting mit der Durchschnittsberechnung wirklich auf ein höheres Level gebracht, auch weil die Eigenbewertung dadurch entfällt und trotzdem nicht alle Teilnehmer voten müssen. Auch andere Sachen sind jetzt besser - z.B. ist Missbrauch fast unmöglich, weil die Stimmen verifiziert werden müssen und die Links im Startbeitrag nur noch für angemeldete Benutzer sichtbar sind.


    Das ist so jetzt schon 'ne solide Sache.


    Letztendlich hängt vom Mindsetting der Teilnehmer ab, ob die Challenges cool ablaufen oder nicht. Sehr dünnhäutig zu sein ist z.B. eine schlechte Voraussetzung.

Jetzt mitmachen!

Du hast noch kein Benutzerkonto auf unserer Seite? Registriere dich kostenlos und nimm an unserer Community teil!