Gremlin:图遍历语言

Gremlin简介

Gremlin是Apache TinkerPop
框架下之图遍历语言。Gremlin是一致种植函数式数据流语言,可以使用户采取简单之法子表达复杂的特性图(property
graph)的遍历或询问。每个Gremlin遍历由同样文山会海步骤(可能有嵌套)组成,每一样步都以数据流(data
stream)上实行一个原子操作。

Gremlin包括三只主导的操作:

  • map-step
    本着数码流中的对象开展转移;
  • filter-step
    对数码流中的目标就是尽过滤;
  • sideEffect-step
    本着数据流进行计算统计;

以下是Gremlin在局部场景被的有血有肉使用:

  • 1.查物色Gremlin朋友的意中人

    g.V().has("name","gremlin").
      out("knows").
      out("knows").
      values("name")
    
  • 2.找那些由个别个朋友一起创立的类

    g.V().match(
      as("a").out("knows").as("b"),
      as("a").out("created").as("c"),
      as("b").out("created").as("c"),
      as("c").in("created").count().is(2)).
    select("c").by("name")
    
  • 3.叫出Gremlin的有着上司,直至CEO

    g.V().has("name","gremlin").
      repeat(in("manages")).
    until(has("title","ceo")).
      path().by("name")
    
  • 4.收获Gremlin合作者的头衔分布

    g.V().has("name","gremlin").as("a").
      out("created").in("created").
    where(neq("a")).
      groupCount().by("title")
    
  • 5.得Gremlin购买产品的连锁产品列表并排序

    g.V().has("name","gremlin").
      out("bought").aggregate("stash").
      in("bought").out("bought").
    where(not(within("stash"))).
      groupCount().order(local).by(values,decr)
    
  • 6.取排名前十的基本人物

    g.V().hasLabel("person").
      pageRank().
    by("friendRank").
    by(outE("knows")).
      order().by("friendRank",decr).
      limit(10)
    

Java
5以前实现多线程有少栽实现方式:一种植是连续Thread类;另一样种是落实Runnable接口。

OLTP 和 OLAP遍历

  • 同样破编写,到处运行
    Gremlin遵循“一潮编写,到处运行”的设计哲学。这意味着不但有着的TinkerPop启用的图形系统都能行Gremlin遍历,而且每个Gremlin遍历都可以被评估也实时数据库查询或批处理查询。(前者为叫作在线交易流程(OLTP),后者叫名在线分析流程(OLAP))。

  • 协调多种图遍历
    这种普遍性是出于Gremlin遍历机实现之。这种分布式、基于图形的虚拟机了解怎么协调多机器图遍历的实践。好处是,用户不需学习数据库查询语言和域特定的BigData分析语言(例如Spark
    DSL,MapReduce等)。Gremlin是构建基于图的应用程序所必需之,其余所有都提交Gremlin遍历机处理。
    图片 1

少数种植方法都要通过重写run()方法来定义线程的一言一行,推荐应用后者,因为Java中之后续是单继承,一个近似闹一个父类,如果继续了Thread类就无法再次持续其他类了,显然使用Runnable接口更为灵活

命令式和声明式遍历

Gremlin遍历可以因命令式(程序式)方式,声明性(描述性)方式编写,也堪分包命令性和声明性的杂方式编写。

  • 命令式编写方式
    取得Gremlin合作者的上级名字分布:

    g.V().has("name","gremlin").as("a").
      out("created").in("created").
    where(neq("a")).
      in("manages").
      groupCount().by("name")
    

    一个命令式的Gremlin遍历告诉运行器如何履遍历中的各级一样步;然后,遍历器分裂到拥有的“Gremlin”的合作方(去除Gremlin自己);下一样步,遍历器走至“Gremlin”合作者的上司(managers),最终依据上面的名进行统计分发。

为此是命令式的Gremlin遍历,就是它不言而喻地、程序化地告知遍历器“去这里,然后去那里”。

  • 声明式编写方式
    以下使用声明式编写方式实现了一样的结果:

    g.V().match(
      as("a").has("name","gremlin"),
      as("a").out("created").as("b"),
      as("b").in("created").as("c"),
      as("c").in("manages").as("d"),
    where("a",neq("c"))).
      select("d").
      groupCount().by("name")
    

    声明式的Gremlin遍历并无克告遍历器执行其的步骤的逐一,而是允许每个遍历器从一个(可能嵌套的)模式的联谊中选取一个模式来实施。

而是,声明遍历具有额外的利益,它不光使用了编译时查询计划器(如命令式遍历),而且还是一个运转时查询计划器,根据每个模式之史统计信息选择下一个履哪个遍历模式

  • 方便那些倾向被减少/过滤大多数数据的模式。

用户可以挑选上述提出的措施编写好之遍历语句。不管怎样,用户的遍历语句都见面因现实的执行引擎和遍历策略traversal
strategies给重写。Gremlin为用户提供灵活性表达自己之询问的;图系统为针对实际启用TinkerPop的数据系统进行中地评估图遍历提供了灵活性。

补偿:Java
5以后创办线程还有第三种艺术:实现Callable接口,该接口中之call方法可以在线程执行了时出一个回来值,代码如下所示:

无缝嵌入主语言

  • 联合主开发语言与图查询语言
    经典数据库查询语言(如SQL)被看与终极以养条件遭到行使的编程语言截然不同。因此,经典数据库要求开发人员既设编制主编程语言,还要编写数据库相应的查询语言。Gremlin统一了之分,因为遍历可以就此支持功能做及嵌套(主要编程语言都支持)的其它编程语言编写。因此,用户的Gremlin遍历可以用应用程序语言(主语言,Host
    language)编写,并受益于主语言及其工具(例如类型检查,语法高亮,点完等)所提供的亮点。目前有各种Gremlin语言变体,包括:Gremlin-Java,Gremlin-Groovy,Gremlin-Python,Gremlin-Scala等。

  • 示范程序
    正如之下简单种办法,高低立判:

    public class GremlinTinkerPopExample {
      public void run(String name, String property) {
    
    Graph graph = GraphFactory.open(...);
    GraphTraversalSource g = graph.traversal();
    
    double avg = g.V().has("name",name).
                   out("knows").out("created").
                   values(property).mean().next();
    
    System.out.println("Average rating: " + avg);
      }
    }
    

public class SqlJdbcExample {
  public void run(String name, String property) {

    Connection connection = DriverManager.getConnection(...)
    Statement statement = connection.createStatement();
    ResultSet result = statement.executeQuery(
      "SELECT AVG(pr." + property + ") as AVERAGE FROM PERSONS p1" +
        "INNER JOIN KNOWS k ON k.person1 = p1.id " +
        "INNER JOIN PERSONS p2 ON p2.id = k.person2 " +
        "INNER JOIN CREATED c ON c.person = p2.id " +
        "INNER JOIN PROJECTS pr ON pr.id = c.project " +
          "WHERE p.name = '" + name + "');

    System.out.println("Average rating: " + result.next().getDouble("AVERAGE")
  }
}

 

参考资料

The Gremlin Graph Traversal Machine and
Language

import java.util.ArrayList;

 

import java.util.List;

 

import java.util.concurrent.Callable;

 

import java.util.concurrent.ExecutorService;

 

import java.util.concurrent.Executors;

 

import java.util.concurrent.Future;

 

 

 

class MyTask ``implements Callable<Integer> {

 

``private int upperBounds;

 

 

 

``public MyTask(``int upperBounds) {

 

``this``.upperBounds = upperBounds;

 

``}

 

 

 

``@Override

 

``public Integer call() ``throws Exception {

 

``int sum = ``0``;

 

``for``(``int i = ``1``; i <= upperBounds; i++) {

 

``sum += i;

 

``}

 

``return sum;

 

``}

 

 

 

}

 

 

 

class Test {

 

 

 

``public static void main(String[] args) ``throws
Exception {

 

``List<Future<Integer>> list = ``new ArrayList<>();

 

``ExecutorService service = Executors.newFixedThreadPool(``10``);

 

``for``(``int i = ``0``; i < ``10``; i++) {

 

``list.add(service.submit(``new
MyTask((``int``) (Math.random() * ``100``))));

 

``}

 

 

 

``int sum = ``0``;

 

``for``(Future<Integer> future : list) {

 

``// while(!future.isDone()) ;

 

``sum += future.get();

 

``}

 

 

 

``System.out.println(sum);

 

``}

 

}