Share This Page. Framework beschleunigt die Anwendungsentwicklung von Ultra-Low-Latency-Finanzsystemen. Seit dem Aufkommen des elektronischen Handels ist ein Rennen um Geschwindigkeit gekommen, um die schnellsten und intelligentesten Handelsplattformen zu bauen. Die Ansprechzeit ist von Sekunden auf Millisekunden bis auf Mikrosekunden zurückgegangen Der Antrieb für Mikrosekunden - und Sub-Mikrosekunden-Ansprechzeit ist mit herkömmlicher Software oder einfachen Hardwarearchitekturen einfach nicht möglich, eine Tatsache, die die Annahme der feldprogrammierbaren Gate-Array-FPGA-Technologie in Ultralow-Latency-Systemen vorantreibt. Um das Risiko bei der Entwicklung von Hardware zu reduzieren Beschreibende Sprache HDL-Code nativ auf einer FPGA-Ethernet-Karte, während auch die Entwicklungszeit verkürzt ist, hat AdvancedIO den Einsatz von FPGA-Frameworks für 10-Gigabit-Ethernet-10GE-Kommunikationen vorangetrieben. Das AdvancedIO expressXG-Entwicklungs-Framework-Tool-Set bietet die notwendige Infrastruktur, um einen schnellen Einsatz von Finanzdienstleistungen zu gewährleisten Ermöglicht nahtlose Portabilität auf die neueste Generation von FPGA-Karten.- Rafeh Hulays, PhD, Vice President, Business Development, AdvancedIO Systems Inc. Zusätzliche Informationen. Ich habe über verschiedene Implementierungen von HFT-Systemen auf FPGAs gelesen. Meine Frage ist, welcher Teil von HFT Systeme sind meistens auf FPGAs implementiert. Sind FPGAs immer noch sehr beliebt Ist nur der Feed-Handler auf den FPGAs implementiert Da einige dieser oben beschriebenen Systeme nur einen Feed-Handler auf dem FPGA implementiert haben, weil sich die Strategie zu stark ändert oder zu schwer ist Implementieren auf FPGAs Andere behaupten, dass sie auch Handelsstrategien auf FPGAs oder mit leistungsstarken NICs anstelle von FPGAs implementiert haben, um HFT-Systeme zu bauen, die ich über verschiedene Ansätze gelesen habe, aber ich finde es schwer zu vergleichen, da die meisten Ergebnisse auf verschiedenen Eingabesätzen getestet werden Es ist ein Weg, darüber nachzudenken, dass du etwas in einem ASIC tun kannst, dh direkt in Hardware. Allerdings ist der Prozess der Fertigung an sich schon teuer und man bekommt ein Design, das man nachher nicht ASICs ändern kann Sinn für vordefinierte Aufgaben wie Bitcoin-Bergbau, bekannte Datenverarbeitungsalgorithmen, etc. On der anderen Hand haben wir gewöhnliche CPUs sowie Coprozessor-CPUs und GPUs, die Allzweck sind, aber verarbeiten ein kleines in Bezug auf gleichzeitige Anweisungen gesetzt Von Anweisungen bei einer sehr hohen speed. FPGAs sind die mittlere Boden Sie sind Hardware-Emulatoren und als solche kann als 10x langsamer als tatsächliche Hardware betrachtet werden, aber immer noch viel leistungsfähiger für gleichzeitige Operationen als CPUs, vorausgesetzt, Sie sind in der Lage, die sterben zu verwenden Verbreiten Sie Ihre Logik entsprechend. Einige Verwendungen von FPGAs sind. Video Transcoding zB HD Video Decodierung in TVs sowie verschiedene Datenerfassung Boards. Fixed Datenstruktur Parsing Regex Parsing. Discrete System Simulation zum Beispiel, simulieren das Ergebnis eines Kartenspiels. Lots of Richtig eingebettete Anwendungen wie zB in der Luft - und Raumfahrt oder wissenschaftliche Forschung. Das Problem mit FPGAs für Quantgebrauch ist, dass es nicht so gut für Gleitkomma-Berechnungen ist, zumal normale CPUs bereits für das mit Sachen wie SIMD optimiert sind Punkt-oder feste Größe Datenstrukturen, FPGA-Design ermöglicht es Ihnen, das Gerät zu konfigurieren, um eine Menge Verarbeitung zur gleichen Zeit zu tun. Einige Dinge im Handel sind mit FPGA für Feed-Handler analysieren direkt aus dem Netzwerk-Stream sowie Gebäude bestimmte Teile der Handelsstruktur, zB Auftragsbücher in der Hardware, um mit der sich schnell verändernden Datenstruktur fertig zu werden, ohne die CPU zu laden. FPGAs zielen vor allem darauf ab, die Sorge um schnelles Verarbeiten von Daten ohne Bezahlung der Ausbreitungskosten zu bewältigen. Dies steht insbesondere im Gegensatz zu Geräte wie GPGPU oder jede PCI-Wohnung Karte, wie Xeon Phi, die Leistung Strafen für das Erhalten von Daten aus dem Gerät, die DMA-Optionen sind in dieser Hinsicht zu verbessern. FPGA s sind wirklich nichts mehr als die gleichen Logik-Blöcke Wiederholt immer wieder im Silizium, mit konfigurierbaren Schaltern zum Verbinden der Logikblöcke zusammen Das macht FPGAs sehr gut - und schnell - im Umgang mit sich wiederholenden Problemen, die in einer Hardware-Schaltung beschrieben werden können, die sich während des Betriebs nicht ändert und Sie Kann buchstäblich Tausende oder Zehntausende dieser Schaltungen haben, die alle parallel zur gleichen Zeit arbeiten, in nur einem FPGA. CPU s auf der anderen Seite basieren um die ALU, die Lasten lädt, lädt Daten, arbeitet auf den Daten, Vielleicht speichert die Ergebnisse, und dann tut es immer wieder CPUs dann sind sehr gut - und schnell - im Umgang mit Problemen, die sich ständig verändern - sowohl in der Größe als auch im Umfang und beim Umschalten zwischen verschiedenen Aufgaben Heute s CPU oder Core wird bis zu Hunderte von ALUs mit parallelen Pipelines für Daten und Anleitungen haben, was sie bei komplexen Problemen, die parallel bearbeitet werden können, sehr schnell macht. Diese Designs machen FPGAs schneller bei einfacheren Problemen, die mit einer großen Parallele angegriffen werden können Architektur - wie zum Beispiel das Verdichten von mehreren Daten-Feeds in weniger als Mikro-Sekunde, Draht-zu-Draht-oder Auslösen eines vorberechneten Kaufs, verkaufen oder stornieren auf einem Preis, der ein bestimmtes Muster CPU s sind schneller bei komplexeren Problemen Die weniger Parallelität erfordern, wie die Berechnung des Korbes von Käufen, Verkäufen und Stornierungen, die erforderlich sind, um ein Portfolio risikoadjustiert zu halten oder eine Reihe von Preis - und Nachrichtenquellen unterschiedlicher Alter und Qualität in Handelsindikatoren zu integrieren, die von Händlern und Managern verwendet werden, um zu entscheiden, welche Anpassungen Sie werden zum handelsystem machen. Wenn FPGAs in HFT verwendet werden, hängt viel von der Architektur des jeweiligen Geschäftes ab. Sie werden am besten verwendet, um einfache, sich wiederholende, breite Aufgaben zu verwirklichen und sie schnell auszuführen. CPUs sind ein Schweizer Messer, das alles tun kann , Vor allem, wo die Anforderungen ändern und die Dimensionen des Problems sind nicht vollständig verstanden am Anfang. Jemand 11-18 bei 17 10.Ihre Frage macht wirklich nicht viel Sinn Es ist wie zu fragen, wie viel von der Verdrahtung in der Handelsinfrastruktur verwendet Optik Faser und wie viel von ihm verwendet Kupfer Die beste Antwort, die wir Ihnen geben können, ist, dass ein FPGA ist nicht ein magic bullet. This ist eine falsche Interpretation von Cisco s Whitepaper Es gibt sehr wenig Überschneidungen zwischen den Einsatz Fällen von Switching-Gewebe und Die von einem FPGA. what Teil der HFT-Systeme sind meist auf FPGAs heutzutage implementiert. Zur Zeit werden FPGAs oft in unseren Druckern und TV-Set-Top-Boxen verwendet. answered Mar 9 14 bei 21 55. Ich möchte die digitale Signalverarbeitung DSP hervorheben Block mit ALUs Heute haben FPGAs Hunderte von programmierbaren DSP-Blöcken die größten mit Tausende. Jetzt haben Sie plötzlich Tausende von kleinen Prozessoren zu Ihrer Verfügung, alle in der Lage, Berechnungen parallel durchzuführen Dies ist weit über die Parallelität von der Xeon zur Verfügung gestellt Phi oder GPUs In der Tat, wenn Sie tun, um Optionen Preismodellierung oder stochastische Risikomodellierung auf FPGA, können Sie mehr als 100-fache Leistungssteigerung im Vergleich zu den neuesten GPUs und noch mehr im Vergleich zu den neuesten CPUs. Mit den DSP-Blöcke , Der andere Hauptfaktor in diesem Leistungsgewinn ist der Speicher-Cache FPGA hat eingebaute verteilte RAM, die extrem schnell ist, so dass Bandbreite von 100TB s auf Datapath-Ebene erreicht werden kann. Mit heute FPGAs für Algo-Strategien gibt große und massiv gleichzeitige Berechnung Ressource, die in der Lage ist, 100 bis 1000-fache Leistungssteigerung im Vergleich zu GPUs oder CPUs zu geben. Die Haupt-Einschränkung ist, dass Sie in Schreiben in Verilog oder VHDL kompetent sein müssen. Sanjay Shah CTO Nanospeed. answered Aug 5 14 um 18 05.A Eine Vielzahl von leistungsstarken, vielkernigen Prozessoren fangen an, sich in den Hardware-Beschleunigungsraum zu begeben, der zuvor vollständig von FPGAs besessen wurde. Unternehmen wie Tilera, Adapteva und Coherent Logix stellen diese Prozessoren hier in den USA zur Verfügung, mit Enyx aus Frankreich auch Einspruch zu machen. Das wahre Maß für die Wirksamkeit dieser massiv parallelen Prozessoren liegt in der Reife ihrer Software-Tools Das ist, wo der potenzielle Benutzer sollte ihre Aufmerksamkeit konzentrieren Niemand will zu programmieren oder zu debuggen Zehner oder Hunderte von Kerne mit manuellen Techniken Natürlich geht es Ohne zu sagen, dass IO-Bandbreite ist so wichtig. In meiner persönlichen Erfahrung in diesem Raum Ich sehe Kunden Annahme von Coherent Logix-Prozessoren als Co-Prozessoren oder Hardware-Beschleuniger für C-Sprache Algo-Beschleunigung Durch den Genuss der schnelle Design-Zyklus einer C-basierten Umgebung, Algo-Programmierer können Code auf ihre Herzen Inhalt und nicht Sorgen über kostspielige und zeitintensive HDL-Codierung für FPGAs. Die optimale Partitionierung ist es, FPGAs zu tun, was sie am besten tun - feste Wiederholungsoperationen - und haben viele Core-Prozessoren tun, was sie am besten tun Beschleunigen algo entwickler produktivität und ausführung speed. John Irza, Business Development Manager, Coherent Logix, Inc. anwered Aug 6 14 bei 0 42.Nearly alle HFT-Shops nutzen FPGA-Architektur Diese Geräte müssen häufig ersetzt werden, da die schnell überholt werden durch die neuesten Verbesserungen in der Geschwindigkeit, Pipelines, Parallelität, etc Es sei denn, Sie sind bereit, 2M pro Jahr zu investieren, herauszufinden, eine andere Strategie Lot von Jungs tun täglich Preis bewegt mit Stift und Papier machen Milliarden in Omaha, NB. answered Jul 28 16 um 10 31. Ihre Antwort.2017 Stack Exchange, Inc. Argon Entwerfen Sie eine FPGA-basierte HFT-Plattform. In einer Pressemitteilung heute Argon Design von Cambridge in Großbritannien haben angekündigt, was sie beschreiben als Hochleistungs-Handelssystem mit einer heterogenen Mischung von Technologien, um den Handel zu minimieren Latenz. Die Mischung von Technologien wird durch ihre Verwendung der Arista Networks 7124FX Anwendungsschalter, die mit einem Altera FPGA mit Hardware-Ebene Zugriff auf 8 seiner 24 10Gb Ethernet-Ports und eine x86-Domain auf Intel s Xeon-Prozessoren Projekt-Fallstudie auf der Argon-Website haben sie ein Prototyp-System entwickelt, bei dem die Marktdaten-Feed-Analyse und die schnelle Pfad-Trade-Ausführung direkt auf dem Switch unter Regeln durchgeführt werden, die parallel zu herkömmlichen Prozessoren bestimmt werden. Direct FPGA-Zugriff ermöglicht Daten-Feeds Analysiert und analysiert werden so nah wie möglich an die Futtermittel-Handler Ähnlich der heterogene Prozessor-Mix in den Switch ermöglicht es, andere verwandte Funktionen durchgeführt werden und Aufträge wieder auf den Draht ausgeführt werden in CoLo an den Handelsplätzen im Rahmen der täglichen Mischung von Technologie gefunden in den Racks heute diese Technologie kann das Design und die Leistung der Handelsfunktionalität auf ein höheres Niveau der Leistung. Argon haben diese höhere Leistungsniveau durch. Mit dem Test-Kabelbaum für die Finteligent Trading Community-Programm entwickelt, die Latenz gemessen wurde Reduziert um einen Faktor von 25 über reine x86-Entwürfe, die durch das Programm getestet wurden Für den gemessenen Bein im Testkabelbaum wurde die Latenz von einem früheren von 4.600ns auf 176ns für algorithmisch erzeugte Trades reduziert, die an den simulierten Markt ausgeführt wurden. Die Leistungssteigerung war Erreicht durch die Bereitstellung eines schnellen Pfades, wo Trades direkt von der FPGA ausgeführt werden unter der Kontrolle der Trigger-Regeln von den x86-basierten Funktionen verarbeitet Die Latenz wird durch zwei zusätzliche Techniken in der FPGA Inline-Parsing und Vorbezug reduziert. Wenn Marktdaten eingegeben wird Der Schalter, der Ethernet-Rahmen wird seriell analysiert, da die Bits ankommen, so dass Teilinformationen extrahiert und abgestimmt werden können, bevor der gesamte Rahmen empfangen wurde. Anstatt zu warten, bis zum Ende eines potentiellen auslösenden Eingangspakets, wird die Voreinstellung verwendet, um das Senden zu starten Der Overhead-Teil einer Antwort, die die Ethernet-, IP-, TCP - und FIX-Header enthält Dies ermöglicht den Abschluss einer ausgehenden Bestellung fast unmittelbar nach dem Ende des auslösenden Markt-Feed-Pakets Der Gesamteffekt ist eine drastische Reduzierung der Latenz, um das Minimum zu erreichen Ist theoretisch möglich. Hier sa Video Argon produziert zeigen ihre Prototyp System s Leistung, die mit dem Finteligent Test Kabelbaum beurteilt werden. Wenn Sie genau zuhören, werden Sie feststellen, dass Argon behaupten, dass. Der Schalter macht Marktaufträge auf Marktinformationen mit Ende des Pakets basiert Bis Ende der Paketreaktionszeiten von etwa 170 ns. Nach dieser Pressemitteilung noch einmal, Arista s Regional Director für Finanzdienstleistungen Paul Goodridge kommentiert. Dies ist genau die Art von praktischen Anwendung, die wir sehen wollen, aus dem Markt mit unserem 7124FX Produkt und wir freuen uns über das Engagement und den Ansatz von Argon Design. Dieses Joint Venture veranschaulicht die Innovation von Arista und unterstreicht den realen Wert von Arista s EOS Extensible Operating System und seine Fähigkeit, die Programmierbarkeit auf den Ethernet Switching-Markt zu bringen Um mit Paul zu sprechen, und ich fragte ihn nach dieser Programmierbarkeit Wie von der 7124FX Datenblatt vorgeschlagen, ist EOS im Wesentlichen aus dem Regal x86 Fedora 14 Linux, aber eine gute Kenntnis von Verilog wird praktisch sein, wenn Sie finden, dass Sie die FPGA selbst programmieren müssen Als ich nach Entwicklungssystemen fragte, schlug Paulus einen guten ersten Schritt vor, um ein Altera Stratix III oder IV Development Kit zu bekommen, die leichter verfügbar sind und auch eine Menge billiger als ein 7124FX sind. Zum Schluss habe ich Paul gefragt, ob es etwas gibt Er möchte zu dem hinzufügen, was er in der Argon-Pressemitteilung sagte. Er betonte. Aristas Fokus auf die Ermächtigung unserer Kunden und die deterministische Leistung unserer Switches. Es scheint, dass mit einem modicum der zusätzlichen Programmierung Arista s Kunden werden bald Ermutigt werden, den deterministischen Hochfrequenzhandel in der Nähe der Lichtgeschwindigkeit zu starten. Der einzige Nachteil ist natürlich, dass der Preis dieser Art von Kit auch ziemlich astronomisch ist. Update - Argon Design haben uns mit diesem Weißbuch für Sie zur Verfügung gestellt, um in Ihrer Freizeit zu lesen.
No comments:
Post a Comment