Ich glaube, daß du mittlerweile so im Detail verstrickt bist, daß dir unser Blick für den Ersteindruck fehlt. Laß es mal mindestens ne Woche ruhen und hör dann rein.
Sicherlich wird mir mehr Distanz nicht schaden. So tue ich gut daran, mich ein Weilchen keine Schwingungsperiode lang mit dem virtuellen Instrument zu beschäftigen. Vielmehr möglichst viel echte Klaviermusik so aufmerksam wie möglich zu hören. Und wenn ich richtig mutig bin, belästige ich das Sortiment eines Klavierfachgeschäfts mit meinen Anfängerfingern, vor allem um die Klangvarianzen zwischen den Fabrikaten mit den eigenen Ohren zu erleben. Ach, und außerdem sorge ich für Weltfrieden und dafür, dass Oma warme Socken kriegt. ;)
Auditorische Erfahrung fehlt mir wirklich. Bisher kenn ich ja nur mein billiges Clavinova, das ich bald nach der Garantiezeit gegen etwas auszutauschen plane, das meinen bis dahin erworbenen pianistischen Fertigkeiten würdig ist, und den Konzertflügel meines Lehrers.
Und ganz gewiss werde ich endlich mal echte Klavierklänge von CDs konkret fourier-analysieren, nicht mehr nur mit Literatur und unbedarftem Anfängergeist bewaffnet herumstümpern. Wenn auch letzteres in den Augen eines Zen-Sympathisanten durchaus gut ist, aber in so konkreten Dingen wohl nicht wirklich zielführend.
Und es ist ja auch nicht so, dass es eine harte Grenze zwischen den Konzepten gäbe. Dass die Basssaiten ganz anders beschaffen sind, ja sogar ganz anders gespannt, sollte ich zumindest dahingehend berücksichtigen, dass der tiefsten Saitendreiergruppe des Diskant ein eigenes explizites Profil zukommen sollte (Profil ist sowas wie ein 3D-Diagramm, die Achsen sind die Amplitude, die Teiltonordnungszahl und die Zeit).
Übrigens,
@Sechstasten,
@Klavierbauermeister:
Darf ich sicherheitshalber fragen, auf welches MP3 in welchem Post euer Urteil bezogen ist? Doch das zuletzt hochgeladene, das Lied der Loreley, vom Donnerstag dem 18.5.? Wie würdet ihr den Unterschied des ersteren zum zweiteren bewerten?
@andreg:
Freut mich, dass du dich mit dem Listing beschäftigt hast. Die in den verlinkten Klavierstudien I wiederum verlinkte Instrumentenspezifikation ist ja schon etwas älter, bei Interesse schaue dir mal die z.Z.
aktuelle Version an, die ich auch für die besagte Aufnahme des Loreley-Lieds letztens verwendet habe.
Die wesentliche Änderung ist, dass ich die Definition der Saiteninharmonizität ausgelagert habe in die Ganzzahlenliste "SPREAD", die einmalig definiert, aber gleichsam für alle angegebenen "PROFILE" angewendet wird. über die Bezeichnung bin ich nicht sehr glücklich, aber sie ist allgemein und kurz genug, jetzt ist sie fix. Ich habe wenig Ahnung genug, dass ich diese Daten wenigstens nicht "HANNAH" oder "JOSHUA" nenne, weil mir "DIFFERENCES_TO_NATURAL_HARMONICS" wieder zu lang wäre. Hat jedes angegebene Profil seine eigenen Abweichungen wie in der Version, die du dir angeschaut hast, ist die Berechnung der Saiteninharmonizität für die nicht angegebenen, also interpolierten Profile für 84 Tasten fehlerhaft weil divergierend. Bei Einzeltönen kann man das nicht hören. Jedoch Akkorde mit zwei oder drei beteiligten Tönen, die aus interpolitierten Profilen erzeugt wurden, litten unter grausigen Schwebungen, weshalb sich das Klavier so anhörte wie ein Akkordeon mit Rissen oder so.
Die Teiltonfrequenzen ergeben sich bekanntlich aus den Vielfachen der Grundfrequenz. Also f = f0 * 2^(x/1200). x wird akkumuliert, also ist nicht nur die jeweilige angegebene Differenz, sondern diese muss jeweils addiert werden mit den 1200 Cent der natürlichen harmonischen Obertonreihe sowie der Summe der analog berechneten Werte aller unterhalb liegenden Teiltöne.
Angaben wie
{ "@edb65p01": 7, "@fhdupdn": 2 } repräsentieren gewichtete Mittel der referenzierten Stützpolygone, also deren Koordinatenketten, die im oberen Teil der Datei hinter ihren Identifiern angegeben sind. Die Gesamtlängen stehen immer ganz am Anfang vor dem Doppelpunkt und legt fest, dass das Segment maximal bzw. bei Attack exakt so viele Sekunden lang ist, bei Sustain werden die Länge und die Koordinaten so angepasst, dass Attack und Sustain zusammen die geforderte Tondauer ergeben. Sie sind zu lesen als "(@edb65p01*7 + @fhupdn*2) : (7 + 2)". Die Stützpolygone heißen so, weil sie eckig sind, aber die Kurven, die aus diesen angegebenen Polygonen mit der sogenannten Bézier-Bernstein-Approximation berechnet werden, sind natürlich nicht eckig. Zumindest nicht innerhalb eines Attack-, Sustain-, bzw. Release-Segments. Die Segmente werden aber, unter Inkaufnahme von Ecken, teils ist das auch gewollt, zu Hüllkurven zusammengesetzt. Diese Hüllkurven werden einfach mit den Sinusschwingungen und der Maximalamplitude multipliziert, die Produkte wiederum summiert, und fertig ist der Klang.
Mangels Angaben aus der Literatur (Blackham 1965, Hinweis auf die deutsche Übersetzung siehe Link) konnte ich nur die Teiltonverhältnisse der ersten vier G-Tasten berücksichtigen, und Blackham hatte nur die Partialtöne 1-5, 10, 15, 20 und 25 des tiefsten C-Tons vermessen.
Der Rest ist interpoliert, und zwar ebenfalls per gewichteter Mittelung. Was schon eine Herausforderung war für mich, der Mathematik am Gymnasium nicht geliebt hat.
Die Herausforderung bestand nicht in der Berechnung von Mittelwerten, das ist ja trivial. Aber wie mittelt man Bézierkurven bzw. Stützpolygone mit unterschiedlicher Zahl von Koordinaten? Wo berechnet man n zusätzliche Zwischenkoordinaten, wie ermittelt man, welche n Knoten man minimalinvasiv, d.h. mit minimaler Änderung des Kurvenverlaufs entfernen kann, damit das Mitteln von schließlich gleich vielen Koordinaten auf der einen wie auf der anderen Seite nur noch Kür ist? Hier musste ich noch mal eingehend mein Tafelwerk kapieren, das ich noch aus der Schulzeit aufgehoben hatte, vor allem Geometrie/Dreiecksberechnungen.
Die y-Angaben der Stützpolygon-Koordinaten (die x-Angaben sind relativ zur Gesamtlänge), sowie die Teilton-Amplitudenverhältnisse der Profile, sind logarithmisch zu interpretieren. Meist nehme ich als Maximum 100dB an. Tontechniker und Akustiker rechnen lieber ausgehend von 0dB als Maximum, also überwiegend mit negativen Werten, aber das mag ich nicht, ich neige schon sonst genug zu negativem Denken. Diese 100dB repräsentieren die tatsächlich eingestellte Abspiellautstärke der Audiohardware (Computerlautsprecher, HIFI-Verstärker, was auch immer), sollten also selbstverständlich nicht als 100dB rauskommen, da euch euer Gehör lieb und teuer ist.
Zur Berechnungsdauer dieser Klänge: Wenn ich mein Anfängerstück nur auf einem CPU-Kern berechnen lasse, dauert die Sache auf meinem IBM-Thinkpad R400 (etwa 9 Jahre alt): 178 Sekunden durch 89 unterschiedliche Noten (Tonhöhe, -dauer, -intensität), durchschnittlich also zwei Sekunden. Die Tonhöhe bestimmt dabei die Anzahl der Teiltöne, die zusammen mit der Tondauer am wesentlichsten die Berechnungszeit beeinflusst. Und zwei Sekunden sind recht fix angesichts von Millionen von Abtastungen insgesamt, 48.000 pro Sekunde und Teilton.
Mit diesen Erklärungen werde ich den einen oder anderen bestimmt enttäuscht haben. Erwarte ich denn wirklich, das aus diesen Milchmädchenrechnungen und allerhand Interpolation und Spekulation am Ende ein Klavier rauspurzelt?! Nein, das erwarte ich nicht. Aber die Richtung sollte wenigstens stimmen. Dass das nicht der Fall ist, holt mich nicht gerade sanft auf den Boden der Tatsachen zurück ... und es ist kein Wunder, schließlich ist mein Bewertungsmaßstab etwas anders als eurer, das habe ich bisher nicht so klar gesehen wie jetzt.
Ihr habt Klaviere dutzender Fabrikate und der unterschiedlichsten Zustände und Qualitäten in den Ohren, ich dagegen vergleiche da eher ein Klavier mit einem Schlagzeug, einer Geige oder ... ja, einer Trompete. Leider ist
@Klavierbauermeister nicht näher begründend darauf eingegangen. Mein Horizont ist weiter, dafür grob, eurer enger, dafür genauer. Daher ist die Diskussion schwierig, wie bei zwei Menschen in der Wüste, drei Meilen voneinander entfernt und per Satellitentelefon verbunden, und der eine fragt den anderen, ob er sich in die richtige Richtung bewege. Das kann der andere selbst mit Fernrohr auch nicht erkennen, und vielleicht guckt er nur gelangweilt und lax dahin, und denkt insgeheim, wegen der flirrenden Hitze am Horizont könne er das doch eh nicht beurteilen.
Einer klavierspielenden Bekannten hatte ich kürzlich ein Stück mit hohem Bassnotenanteil zu hören gegeben (das ich leider aus urheberrechtlichen Gründen nicht veröffentlichen darf, aber wer mir ein einfaches Public-Domain-Stück vorschlagen mag, gerne her mit den Noten, Link reicht). Sie war erstaunt über die Echtheit der Bassklänge. Über das Klangverhalten im Bass konnte ich mehr aus besagter Literatur ziehen. Und auch Diskant habe ich mich in Ermangelung richtiger Analysen daran geklammert, in abnehmendem Maße bis hin zum ungefähren Stimmgabel mit nur sieben Teiltönen. Naiv-spekulativ eben, um mal zu gucken was rauskommt. Aber ich hoffe ihr könnt nachvollziehen, dass ich nach diesem Lob zum Bassbereich überzeugt bin vom grundsätzlichen Ansatz, da bringt mich auch
@Andre73 so schnell nicht von ab ;).
Weiterhin: Die Mathematik sagt, dass man Betrag und Phase für die Resynthese berücksichtigen muss. Wie ist die Phase bei Dir modelliert? Ist sie für alle Obertöne null oder konstant oder ...?
Ich sehe keinen Anlass, die Phase zu modellieren. Ich vertraue da auf olle Helmholtz, der in seiner Lehre der Tonempfindungen schrieb, dass Phasenverschiebungen vom Ohr wegabstrahiert werden. Wenn Helmholtz inzwischen wiederlegt wurde, weiß ich davon nichts.