Beim RayTracing ist die Berechnung der einzelnen Bildpunkte relativ unabhängig voneinander. Man kann deshalb gute Beschleunigungen durch einfaches Parallelisieren der EyeRays und damit der Strahlbäume erreichen. Nutzt man jedoch Caching-Strategien oder verwendet man oben erwähnte Undersampling- oder Oversampling-Techniken, ist nicht jede Aufteilung gleich gut. Ferner muss gleichmäßige Verteilung der Arbeit (`load balancing') berücksichtigt werden.
Ein wesentlicher Punkt bei dieser Art der Parallelisierung besteht darin, dass jedem Prozessor die Information über die gesamte Szene zur Verfügung stehen muss. Dies erreicht man entweder dadurch, dass jeder Prozessor die komplette Beschreibung erhält, oder dadurch, dass man eine `shared memory'-Struktur (zumindest zum Lesen) implementiert. Ist die Szenebeschreibung sehr groß oder dynamisch--man möchte z.B. eine Sequenz von Bildern mit sich bewegenden Objekten erzeugen--dann steigt der notwendige Kommunikationsaufwand in einem verteilten System schnell an.
Als einfache Aufteilungsmethoden kommen zeilen- oder spaltenweise Aufteilung, pixelweise feste Zuordnung oder blockweise Zuordnung in Frage (siehe Abbildung). Zudem können Warteschlangen implementiert werden, die den Lastausgleich verbessern. Meiner Meinung ist blockweise Aufteilung mit Warteschlange am besten, da sie auch sehr gut Caching-Strategien ermöglicht.