Iterative Deepening A Star in R

Gepostet: , Zuletzt aktualisiert:

iterative_deepening_a_star <- function(tree, heuristic, start, goal){
  #' Performs the iterative deepening A Star (A*) algorithm to find the shortest path from a start to a target node.
  #' Can be modified to handle graphs by keeping track of already visited nodes.
  #' @param tree      An adjacency-matrix-representation of the tree where (x,y) is the weight of the edge or 0 if there is no edge.
  #' @param heuristic An estimation of distance from node x to y that is guaranteed to be lower than the actual distance. E.g. straight-line distance.
  #' @param start     The node to start from.
  #' @param goal      The node we're searching for.
  #' @return number shortest distance to the goal node. Can be easily modified to return the path.
  
  threshold = heuristic[start,goal]
  repeat{
    cat("Iteration with threshold: ", threshold, "\n")
    distance = iterative_deepening_a_star_rec(tree, heuristic, start, goal, 0, threshold)
    if(distance == Inf){
      # Node not found and no more nodes to visit
      return (-1)
    }else if (distance < 0){
      # if we found the node, the function returns the negative distance
      print("Found the node we're looking for!")
      return (-distance)
    }else{
      # if it hasn't found the node, it returns the (positive) next-bigger threshold
      threshold = distance
    }
  }
}

iterative_deepening_a_star_rec <- function(tree, heuristic, node, goal, distance, threshold){
  #' Performs DFS up to a depth where a threshold is reached (as opposed to interative-deepening DFS which stops at a fixed depth).
  #' Can be modified to handle graphs by keeping track of already visited nodes.
  #' @param tree      An adjacency-matrix-representation of the tree where (x,y) is the weight of the edge or 0 if there is no edge.
  #' @param heuristic An estimation of distance from node x to y that is guaranteed to be lower than the actual distance. E.g. straight-line distance.
  #' @param node      The node to continue from.
  #' @param goal      The node we're searching for.
  #' @param distance  Distance from start node to current node.
  #' @param threshold Until which distance to search in this iteration.
  #' @return number shortest distance to the goal node. Can be easily modified to return the path.
  
  cat("Visiting Node ", node, "\n")
  
  if(node == goal){
    # We have found the goal node we we're searching for
    return (-distance)
  }
  estimate = distance + heuristic[node,goal]
  if(estimate > threshold){
    cat("Breached threshold with heuristic: ", estimate, "\n")
    return (estimate)
  }
  # ...then, for all neighboring nodes....
  min = Inf
  for(i in seq_along(tree[node,])) {
    if(tree[node,i] != 0){
      t = iterative_deepening_a_star_rec(tree, heuristic, i, goal, distance + tree[node,i], threshold)
      if(t < 0){
        # Node found
        return (t)
      } else if  (t < min){
        min = t
      }
    }
  }
  
  return (min)
}

Über den Algorithmus und die Programmiersprache in diesem Snippet:

Iterative Deepening A Star Algorithmus

Der A-Star Algorithmus mit iterativer Vertiefung (IDA & ast;) ist ein Algorithmus, der verwendet wird, um das Problem des kürzesten Pfades in einem Baum zu lösen, kann jedoch modifiziert werden, um Graphen (d. H. Zyklen) zu handhaben. Es baut auf der ID-DFS (Iterative Deepening Depth-First Search) auf, indem eine Heuristik hinzugefügt wird, um nur relevante Knoten zu untersuchen.

Beschreibung des Algorithmus

Während Iterative Deepening DFS eine einfache Tiefe verwendet, um zu entscheiden, wann die aktuelle Iteration abgebrochen und mit einer höheren Tiefe fortgesetzt werden soll, Iterative Vertiefung Ein Stern verwendet eine Heuristik, um zu bestimmen, welche Knoten erforscht und in welcher Tiefe gestoppt werden soll. Dies ähnelt der Art und Weise, wie Dijkstra den Knoten immer mit dem derzeit kürzesten Unterschied untersucht und A Star eine Heuristik hinzufügt, um nur Knoten zu untersuchen, die tatsächlich näher am Ziel liegen.

Im Einzelnen führt dies zu den folgenden Schritten:

  1. Für jedes Kind des aktuellen Knotens
  2. Wenn es sich um den Zielknoten handelt, kehren Sie zurück
  3. Wenn der Abstand plus die Heuristik den aktuellen Schwellenwert überschreitet, geben Sie diesen Schwellenwert zurück
  4. Setzen Sie den aktuellen Knoten auf diesen Knoten und kehren Sie zu 1 zurück.
  5. Nachdem Sie alle Kinder durchlaufen haben, gehen Sie zum nächsten Kind des Elternteils (dem nächsten Geschwister).
  6. Nachdem Sie alle untergeordneten Elemente des Startknotens durchlaufen haben, erhöhen Sie den Schwellenwert auf den kleinsten der überschrittenen Schwellenwerte.
  7. Wenn wir alle Blattknoten (unten) erreicht haben, existiert der Zielknoten nicht.

Beispiel des Algorithmus

Betrachten Sie das folgende Diagramm: Grafik für den Iterative Deepening A Star (IDA *) -Algorithmus für kürzeste Wege

Die Schritte, die der Algorithmus in diesem Diagramm ausführt, wenn Knoten 0 als Startpunkt und Knoten 6 als Ziel in der angegebenen Reihenfolge angegeben werden, sind:

  1. Iteration mit Schwelle: 6.32
  2. Besuche Knoten 0
  3. Besuche Knoten 1
  4. Schwelle mit Heuristik überschritten: 8.66
  5. Besuche Knoten 2
  6. Schwelle mit Heuristik überschritten: 7.00
  7. Iteration mit Schwelle: 7.00
  8. Besuche Knoten 0
  9. Besuche Knoten 1
  10. Schwelle mit Heuristik überschritten: 8.66
  11. Besuche Knoten 2
  12. Besuche Knoten 5
  13. Schwelle mit Heuristik überschritten: 8.83
  14. Iteration mit Schwelle: 8.66
  15. Besuche Knoten 0
  16. Besuche Knoten 1
  17. Besuche Knoten 3
  18. Schwelle mit Heuristik überschritten: 12.32
  19. Besuche Knoten 4
  20. Schwelle mit Heuristik überschritten: 8.83
  21. Besuche Knoten 2
  22. Besuche Knoten 5
  23. Schwelle mit Heuristik überschritten: 8.83
  24. Iteration mit Schwelle: 8,83
  25. Besuche Knoten 0
  26. Besuche Knoten 1
  27. Besuche Knoten 3
  28. Schwelle mit Heuristik überschritten: 12.32
  29. Besuche Knoten 4
  30. Besuche Knoten 2
  31. Besuche Knoten 5
  32. Besuche Knoten 6
  33. Den Knoten gefunden, den wir suchen!

Endgültig niedrigster Abstand von Knoten 0 zu Knoten 6: 9

Beachten Sie, dass der Algorithmus in der Iteration, in der er den Zielknoten gefunden hat, nicht weiter von Knoten 3 aus nach unten gesucht hat. Wenn Knoten 3 Kinder gehabt hätte, während Iterative Deepening DFS sie möglicherweise (und unnötig!) Erkundet hätte, hätte Iterative Deepening A Star dies nicht getan.

Laufzeit des Algorithmus

Die Laufzeitkomplexität von Iterative Deepening A Star entspricht im Prinzip der von Iterative Deepening DFS. In der Praxis können jedoch viele der Pfade eliminiert werden, bevor wir untersucht werden, wenn wir eine gute Heuristik wählen, was zu einer signifikanten Zeitverbesserung führt. Weitere Informationen darüber, wie die Heuristik die Komplexität beeinflusst, finden Sie im Wikipedia-Artikel.

Speicherkomplexität des Algorithmus

Die räumliche Komplexität von Iterative Deepening A Star ist die Speichermenge, die für den Baum oder das Diagramm benötigt wird. O(| N|), |N| = Anzahl der Knoten im Baum oder Diagramm, die für Bäume durch b^d ersetzt werden können, wobei b der Verzweigungsfaktor und d ist die Tiefe. Unabhängig davon, welchen Platz die Heuristik benötigt.

R

The R Logo

R ist eine interpretierte Sprache, die erstmals 1993 veröffentlicht wurde und in den letzten Jahren erheblich an Popularität gewonnen hat. Es wird hauptsächlich für Data Mining und -science sowie für Statistiken verwendet und ist eine beliebte Sprache in Disziplinen außerhalb der Informatik, die von Biologie bis Physik reichen. R ist dynamisch typisiert und verfügt über eine der vielfältigsten Bibliotheken für Statistik, maschinelles Lernen, Data Mining usw.

<! - Ende des Auszugs ->

Anreise zu “Hello World” in R.

Das Wichtigste zuerst - hier erfahren Sie, wie Sie Ihre erste Codezeile in R ausführen können.

  1. Laden Sie die neueste Version von R von r-project.org herunter und installieren Sie sie. Sie können auch eine frühere Version herunterladen, wenn Ihr Anwendungsfall dies erfordert.
  2. Öffnen Sie ein Terminal, stellen Sie sicher, dass der Befehl R funktioniert und dass der Befehl, den Sie verwenden werden, sich auf die Version bezieht, die Sie gerade installiert haben, indem SieR --version ausführen. Wenn der Fehler “Befehl nicht gefunden” (oder ähnlich) angezeigt wird, starten Sie die Befehlszeile und, falls dies nicht hilft, Ihren Computer neu. Wenn das Problem weiterhin besteht, finden Sie hier einige hilfreiche Fragen zu StackOverflow für Windows, Mac und Linux .
  3. Sobald dies funktioniert, können Sie das folgende Snippet ausführen: print (" Hello World "). Sie haben zwei Möglichkeiten, dies auszuführen: 3.1 Führen Sie “R” in der Befehlszeile aus, fügen Sie einfach das Code-Snippet ein und drücken Sie die Eingabetaste (Drücken Sie “STRG + D” und geben Sie “n” gefolgt von der Eingabetaste ein, um das Menü zu verlassen). 3.2 Speichern Sie das Snippet in einer Datei und nennen Sie es etwas, das mit “.R” endet, z. hello_world.R und führen SieRscript hello_world.R aus. Tipp: Verwenden Sie den Befehl ls (dir in Windows), um herauszufinden, welche Dateien sich in dem Ordner befinden, in dem sich Ihre Befehlszeile gerade befindet.

Das ist es! Beachten Sie, dass das Drucken von etwas auf die Konsole nur eine einzige Zeile in R ist - diese niedrige Eintrittsbarriere und das Fehlen des erforderlichen Boilerplate-Codes machen einen großen Teil der Attraktivität von R aus.

Grundlagen in R.

Um in R implementierte Algorithmen und Technologien zu verstehen, muss man zunächst verstehen, wie grundlegende Programmierkonzepte in dieser bestimmten Sprache aussehen.

Variablen und Arithmetik

Variablen in R sind wirklich einfach. Sie müssen weder einen Datentyp deklarieren noch deklarieren, dass Sie eine Variable definieren. R weiß das implizit. R ist auch in der Lage, Objekte und ihre Eigenschaften auf verschiedene Arten einfach zu definieren.

some_value = 10
my_object <- list(my_value = 4)
attr(my_object, 'other_value') <- 3

print((some_value + my_object$my_value + attr(my_object, 'other_value'))) # Prints 17

Arrays

Das Arbeiten mit Arrays ist in R ähnlich einfach:

# Create 2 vectors of length 3
vector1 <- c(1,2,3)
vector2 <- c(4,5,6)

# Create names for rows and columns (optional)
column.names <- c("column_1","column_2","column_3")
row.names <- c("row_1","row_2")

# Concatenate the vectors (as rows) to form an array, providing dimensions and row/column names
result <- array(c(vector1,vector2), dim = c(2,3), dimnames = list(row.names, column.names))

print(result)
# Prints:
#       column_1 column_2 column_3
# row_1        1        3        5
# row_2        2        4        6

Wie diejenigen unter Ihnen, die mit anderen Programmiersprachen wie Java vertraut sind, möglicherweise bereits bemerkt haben, handelt es sich nicht um native Arrays, sondern um Listen, die wie Arrays gekleidet sind. Dies bedeutet, dass Arrays in R erheblich langsamer sind als in Programmiersprachen niedrigerer Ebene. Dies ist ein Kompromiss, den R zugunsten der Einfachheit eingeht. Es gibt jedoch Pakete, die echte Arrays implementieren, die erheblich schneller sind.

Bedingungen

Wie die meisten Programmiersprachen kann R “if-else” -Anweisungen ausführen:

value = 1
if(value==1){
   print("Value is 1")
} else if(value==2){
     print("Value is 2")
} else {
     print("Value is something else")
}

R kann auch switch-Anweisungen ausführen, obwohl sie im Gegensatz zu anderen Sprachen wie Java als Funktion implementiert sind:

x <- switch(
   1,
   "Value is 1",
   "Value is 2",
   "Value is 3"
)

print(x)

Beachten Sie, dass diese Funktion ziemlich nutzlos ist, es jedoch andere Funktionen für komplexere Anwendungsfälle gibt.

Schleifen

R unterstützt sowohl for- als auch while-Schleifen sowie break- und next-Anweisungen (vergleichbar mit continue in anderen Sprachen). Zusätzlich unterstützt R “Wiederholungsschleifen”, die mit “while (true)” - Schleifen in anderen Sprachen vergleichbar sind, aber den Code ein wenig vereinfachen.

value <- 0
repeat {
  value <- value + 1
  if(value > 10) {
    break
  }
}
print(value)

value <- 0
while (value <= 10) {
  value = value + 1
}
print(value)

value <- c("Hello","World","!")
for ( i in value) {
  print(i)
}

for(i in 1:10){
  print(i)
}

Funktionen

Funktionen in R sind einfach zu definieren und erfordern zum Guten oder Schlechten keine Angabe von Rückgabe- oder Argumenttypen. Optional kann ein Standardwert für Argumente angegeben werden:

my_func <- function (
  a = "World"
) {
  print(a)
  return("!")
}

my_func("Hello")
print(my_func())

(Dies druckt “Hallo”, “Welt” und dann ”!“)

Syntax

R erfordert die Verwendung von geschweiften Klammern ({}), um Codeblöcke in Bedingungen, Schleifen, Funktionen usw.; Dies kann zwar zu lästigen Syntaxfehlern führen, bedeutet jedoch auch, dass die Verwendung von Leerzeichen für die bevorzugte Formatierung (z. B. Einrücken von Codeteilen) den Code nicht beeinflusst.

Fortgeschrittenes Wissen in R

Für weitere Informationen hat R einen großartigen Artikel Wikipedia. Die offizielle Website ist r-project.org.